卡內基梅隆大學Ruslan Salakhutdinov教授智源大會主題演講:要將領域知識結合到機器學習中

6 月 21 日,由北京智源人工智能研究院主辦的2020北京智源大會正式開幕(直播入口:https://2020.baai.ac.cn),大會爲期四天,各主題論壇和分論壇將圍繞如何構建多學科開放協同的創新體系、如何推進人工智能與經濟社會發展深度融合、如何建立人工智能安全可控的治理體系、如何與各國攜手開展重大共性挑戰的研究與合作等一系列當下最受關注的問題進行交流和探討。會上,卡內基梅隆大學教授 Ruslan Salakhutdinov進行了主題爲“Integrating Domain Knowledge into Deep Learning”的演講,以下爲InfoQ帶來的內容整理。

首先,Ruslan Salakhutdinov展示了近期所做的一系列研究,主要圍繞深度學習帶來的影響而展開,涉及的領域包括語音識別、計算機視覺、推薦系統、語言理解、藥物發現&醫療影像分析。

Ruslan教授表示,當人們構建AI時通常傾向於從算法着手,因爲開發計算機算法可以讓計算機看到並感知人類身邊的事物。如今,我們在機器學習和深度學習領域所面臨的主要挑戰有四方面,這四種挑戰之間又是相互聯繫的,包括自然語言理解;具象化人工智能,深度強化學習和控制;如何將結構化的領域知識結合到模型中;多模型,半監督、自監督學習。

在進行監督學習訓練時,我們將輸入通過一些神經網絡訓練,最後產生輸出內容。例如,當我們問到哪些冠狀病毒會感染人羣時,我們把從文本、表格或知識本體中得到的領域知識輸入到模型中,然後就可能得到MERS-CoV、SARS-CoV或Covid-19這樣的答案,因此領域知識對於模型十分重要。

同樣地,我們可考慮構建一個知識庫,目前很多公司已經構建了這樣的知識庫,這裏蘊含了相關的領域知識,例如糖尿病可能引起病痛性神經病變,可以通過服用一些藥物進行治療,我們可以人工地建立一種內含各種關聯的知識庫,然後將這個知識庫作爲知識的來源,再把這些領域知識結合到模型中,最終得出答案,這個過程能夠有效地將深度學習和知識庫相結合。

但是,很多時候知識庫並不是完整的,我們還需要從網絡、文本和圖譜中獲得一些補充信息,而將這些信息結合在一起再進行訓練可以很大程度上提高系統的性能。

另一個需要思考的問題是,當我們處理複雜的、多種情況並存的問題時,應該怎麼辦?僅使用深度學習模型和遞歸神經網絡來解決這類問題是相當困難的。Ruslan教授舉了如下例子:

當問到“生產伏格列波糖片的公司總部在哪裏”時,我們需要回答兩個問題,首先是哪個公司生產伏格列波糖,一旦我們知道了這個問題的答案後,就可以問這家公司的總部在哪裏。所以在這個案例中,當我們回答這家公司的總部在哪裏時,首先要知道伏格列波糖片是武田藥物公司的產品,該公司是日本最大的製藥公司,然後就可以知道這家公司的總部位於日本大阪。這也就是我們提到的複雜的、多種情況並存的問題,當我們無法立即知道答案時,就需要將未知信息與從維基百科等不同渠道獲取的信息相結合,才能最終回答出這個問題。

如今,面對這種複雜的問題,很多系統是回答不上來的,因爲系統無法理解這種複雜的問題,甚至再遇到一個複雜的問題裏面包含了3個提問時,回答問題的步驟和順序又是怎樣的,Ruslan教授對此問題進行了講解。

他認爲,回答這種複雜問題,要首先注意回答問題的順序,也就是優先級。但是優先問題不好歸納,而且歸納起來也會很慢,所以我們在思考能否利用深度學習模型來解決這一問題,將模型反向傳播到架構上,以及我們能否更有效地實時回答這類問題。這時候利用領域知識來解決問題就是個非常理想的方式。他表示他的一名學生創立了這樣一個可以實時回答複雜問題的系統,接下來,Ruslan教授舉了一個例子來進一步解釋這個系統。

當我們問及,Steve Jobs創辦的公司哪家總部位於Redwood City時,這個模型就會實時地運行,它就是一臺CPU,能搜索出500萬篇關於Steve Jobs創辦的公司哪家總部位於Redwood City的文章,第一階段需要檢索出Steve Jobs創辦了多少家公司,結果顯示他創辦了蘋果和next,但只有next纔是正確答案,接下來模型就會給你一些信息,比如next公司的總部在哪,哪家公司總部位於Redwood市,你就可以實時地檢索到這兩條信息,然後將兩條信息結合起來,可以得到正確的答案。

Ruslan教授也對該系統如何做到這一點進行了解釋。系統中非常關鍵的點是要做到一些能產生跟隨關係的事情,我們給定一組實體,通常是一組特定的名詞X,然後找出其跟隨關聯R,然後我們得到了一個答案,我們跟隨另一個關聯關係,得到了第二個答案,以此類推得到了一系列實體Y,這裏的X可以表示一種藥品名稱,而這裏的跟隨關聯可能是生產商,基於這個就可以知道哪家公司生產了這種藥品。

跟隨關係可以給出一系列問題的答案,幫我們決定最終的正確答案是什麼,這是非常理想地利用分析算法和利用歸類法解決複雜問題的一種方式。

利用相關跟隨關係方法能讓我們根據一個實體建立起一個矩陣,這種方法的好處是可以雙倍利用跟隨關係創建很多矩陣,也就是相當於創建出了一個極爲複雜的矩陣。之所以認爲這種方式是高效的,是因爲它可以在無需人工干預的情況下自動創建知識庫。

最後,Ruslan教授展示了通過該方法回答複雜問題最後得到的結果,結果表明,通過這種模式比傳統的現有模型效果要好很多,而回答階段性問題的速度也要比圖神經網絡快很多。

該模型在回答第一階段問題時能在每秒鐘處理19個問題,而在回答第三階段每秒能處理12-13個問題。

更多智源大會相關演講內容歡迎訪問:

https://www.infoq.cn/event/?id=138

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章