王海峯詳解百度NLP十年技術完整佈局

自然語言理解(NLP)素有“人工智能皇冠上的明珠”盛譽,這也意味着語言與知識等認知層面的技術突破將進一步促進AI深入發展。AI在向更深層次進化,語言與知識技術的重要性愈加凸顯。語言與知識技術是人工智能認知能力的核心,以語言和知識爲研究對象,讓機器像人一樣掌握知識、理解語言的自然語言處理技術,對於人工智能發展至關重要。

百度NLP十年,完成技術佈局已經形成

8月25日,在百度大腦語言與知識技術峯會上,百度CTO王海峯全面分享了百度語言與知識技術完整佈局和最新成果。

首先,知識圖譜是機器認知世界的重要基礎,百度打造了大規模知識圖譜,擁有超過50億實體和5500億事實,並在不斷演進和更新。百度知識圖譜應用於各行各業,每天的調用次數超過400億次。

其次,在融入知識的基礎上,語言理解能力不斷增強。2019年3月,百度提出知識增強的語義理解框架ERNIE,在深度學習的基礎上融入知識,同時具備持續學習能力,曾登頂全球權威數據集GLUE榜單,首次突破90分,刷新榜單歷史。基於知識圖譜和語義表示,突破了閱讀理解、對話理解以及跨模態深度語義理解等技術。

第三,語言生成是語言與知識技術中的重要組成部分。基於預訓練技術的經驗,百度提出基於多流機制的語言生成預訓練技術,兼顧詞、短語等不同粒度的語義信息,顯著提升生成效果。百度也探索了多文檔摘要生成,通過圖結構語義表示引入篇章知識,在單文檔和多文檔摘要生成效果都有提升。

原文鏈接:【https://www.infoq.cn/article/u8dNES5eRwcHraAVeuVo】。未經作者許可,禁止轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章