Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

原創

2020-07-02 22:05

內容來源：ATYUN AI平臺

自然語言處理（NLP）的技術可以幫助計算機解釋人類語言，能夠帶來令人驚訝的細微差別。其中一個例子就是Facebook新推出的頁面NLP集成，它可以自動從企業的Facebook頁面中提取文本，併爲客戶回答常見問題。但即使是尖端的NLP算法也存在一個問題：它們針對特定任務進行了高度優化。

Salesforce的研究科學家Bryan McCann表示，“深度學習模型通常非常脆弱，你可以有一個適用於翻譯的模型，但是在情感分析或概述上可能不會很好。”

Salesforce Research首席科學家Richard Socher領導團隊雙管齊下地解決了這個問題。他們在PyTorch中開發了10種任務的自然語言處理挑戰：自然語言十項全能（decaNLP）和一種可以解決它的模型，多任務問題應答網絡（MQAN），一個用於Python編程的開源機器學習庫語言。

McCann說：“我們設計了一個可以處理大量不同自然語言處理任務的通用模型。”

DecaNLP通過了語言測試的挑戰，包括問答（在這個測試中，模型接收到一個問題和情境，其中包含了到達答案所必需的信息）和機器翻譯（其中模型翻譯輸入從一種語言到另一種語言的文檔）。有文檔摘要測試，自然語言推理測試，情感分析測試，語義角色標註測試，關係提取測試，面向目標的對話測試，查詢生成測試和代詞解析測試。

爲了判斷模型的性能，研究人員對每個測試的結果進行了標準化，並將它們加在一起，得出一個數字在0到1000之間的decaScore。

研究人員發現，在沒有任何特定於任務的模塊或參數的情況下，MQAN在所有10個測試中聯合訓練，則至少可以執行10個單獨測試。在某些領域，特別是機器翻譯和命名實體識別的轉移學習，情感分析和自然語言推理的領域適應，以及文本分類的能力，與單任務模型相比改進了很多。

McCann指出，“一項訓練任務涉及將自然語言問題翻譯成數據庫查詢語言，我們沒有明確優化，但我們實際上擁有最先進的性能。我們已經降低了解決NLP問題的難度。”

Socher表示，該模型在未經過訓練的任務中表現良好的能力可以爲更強大，更自然的聊天機器人鋪平道路，更好地從人類用戶的問題中推斷出意義。

獲取數據集和培訓的代碼將於今天發佈，同時還有頂級decaScores排行榜。據該團隊介紹，在GPU上訓練模型需要幾天的時間。

論文網址：einstein.ai/static/images/pages/research/decaNLP/decaNLP.pdf

本文轉自ATYUN人工智能媒體平臺，原文鏈接：Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

更多推薦

很高興遇見你，“孤獨”的宇航員

你現在可以通過Alexa控制其它設備

VMware和Nvidia推出用於機器學習的混合雲

標籤：

開源項目自然語言處理NLP

歡迎關注ATYUN官方公衆號

商務合作及內容投稿請聯繫郵箱:[email protected]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

京東面試：如何進行JVM調優？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

Python 將PowerPoint (PPT/PPTX) 轉爲HTML

SQL優化-20231016

上輩子是運動員？一款人臉識別AI應用檢測你與哪個世界盃運動員長得最像

AMAX推出AI訓練和推理平臺DL-E48A，支持超大規模部署

Salesforce開發設計了一個可以處理大量不同NLP任務的通用模型

NVIDIA發佈最新數據增強庫和圖像解碼庫

斯坦福大學研究人員利用AI生成表情包

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結