Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

 

內容來源:ATYUN AI平臺

自然語言處理(NLP)的技術可以幫助計算機解釋人類語言,能夠帶來令人驚訝的細微差別。其中一個例子就是Facebook新推出的頁面NLP集成,它可以自動從企業的Facebook頁面中提取文本,併爲客戶回答常見問題。但即使是尖端的NLP算法也存在一個問題:它們針對特定任務進行了高度優化。

Salesforce的研究科學家Bryan McCann表示,“深度學習模型通常非常脆弱,你可以有一個適用於翻譯的模型,但是在情感分析或概述上可能不會很好。”

Salesforce Research首席科學家Richard Socher領導團隊雙管齊下地解決了這個問題。他們在PyTorch中開發了10種任務的自然語言處理挑戰:自然語言十項全能(decaNLP)和一種可以解決它的模型,多任務問題應答網絡(MQAN),一個用於Python編程的開源機器學習庫語言。

McCann說:“我們設計了一個可以處理大量不同自然語言處理任務的通用模型。”

DecaNLP通過了語言測試的挑戰,包括問答(在這個測試中,模型接收到一個問題和情境,其中包含了到達答案所必需的信息)和機器翻譯(其中模型翻譯輸入從一種語言到另一種語言的文檔)。有文檔摘要測試,自然語言推理測試,情感分析測試,語義角色標註測試,關係提取測試,面向目標的對話測試,查詢生成測試和代詞解析測試。

 

爲了判斷模型的性能,研究人員對每個測試的結果進行了標準化,並將它們加在一起,得出一個數字在0到1000之間的decaScore。

研究人員發現,在沒有任何特定於任務的模塊或參數的情況下,MQAN在所有10個測試中聯合訓練,則至少可以執行10個單獨測試。在某些領域,特別是機器翻譯和命名實體識別的轉移學習,情感分析和自然語言推理的領域適應,以及文本分類的能力,與單任務模型相比改進了很多。

McCann指出,“一項訓練任務涉及將自然語言問題翻譯成數據庫查詢語言,我們沒有明確優化,但我們實際上擁有最先進的性能。我們已經降低了解決NLP問題的難度。”

Socher表示,該模型在未經過訓練的任務中表現良好的能力可以爲更強大,更自然的聊天機器人鋪平道路,更好地從人類用戶的問題中推斷出意義。

獲取數據集和培訓的代碼將於今天發佈,同時還有頂級decaScores排行榜。據該團隊介紹,在GPU上訓練模型需要幾天的時間。

論文網址:einstein.ai/static/images/pages/research/decaNLP/decaNLP.pdf

本文轉自ATYUN人工智能媒體平臺,原文鏈接:Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

更多推薦

很高興遇見你,“孤獨”的宇航員

你現在可以通過Alexa控制其它設備

VMware和Nvidia推出用於機器學習的混合雲

標籤:

開源項目自然語言處理NLP

歡迎關注ATYUN官方公衆號

商務合作及內容投稿請聯繫郵箱:[email protected]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章