谷歌NLP新進展:利用AI改變句子的情緒、時態

在蒙特利爾的NeurIPS 2018會議上,來自密歇根大學和谷歌大腦的論文:《Content preserving text generation with attribute controls》(內容保留文本生成與屬性控制),提出了一種新的機器學習架構,該架構可以從給定樣本生成句子,並且在不改變句子原意的基礎上增加表達情緒的文字,甚至可以添加擬聲詞。

據介紹,這一技術未來可以用在轉述、機器翻譯、會議記錄等系統中,同時該技術還進一步補充了11月份微軟所展示的利用NLP技術對弱結構化文本中的關係進行處理的系統。

閱讀詳細論文可以從以下入口進入:

密歇根大學與谷歌大腦《內容保留文本生成與屬性控制》:
https://papers.nips.cc/paper/7757-content-preserving-text-generation-with-attribute-controls.pdf

微軟研究院《結構化神經概述》:
https://arxiv.org/pdf/1811.01824.pdf

研究人員在論文中寫道:

我們解決了修改句子文本屬性的問題,據我們瞭解,我們演示的是第一個在沒有並行數據的情況下學習並修改給定句子多個文本屬性的實例。

image文本示例:嘗試改變句子的情緒

研究團隊首先解決了情緒控制的問題。他們從一個餐館評論數據集(Yelp評論數據集的過濾版本)和一個IMDB電影評論的大集合中分別獲取了44.7萬句和30萬句的評論,並利用這些評論來訓練系統。

在訓練結束後,研究人員利用一個包含12.8萬個餐館評論和3.6萬個電影評論的測試數據集,試圖基於帶有負面情緒的句子生成帶有正面情緒的文本片段,反之亦然。

之後,研究人員在BLEU(“雙語評估替補”的縮寫)上進行評估,人工智能系統能夠超越兩種領先的文本生成方法。BLEU是評估機器翻譯文本的度量標準。此外,它始終能生成與輸入句子相關的語法正確的句子——以至於亞馬遜的Mechanical Turk上的研究參與者認爲它的輸出比以前的方法更現實。

研究人員表示,生成的句子出人意料地連貫。例如,“櫃檯後面的人一點也不友好”變成了“櫃檯後面的人非常友好,樂於助人”(上圖示例中的第一個案例)。在另一個例子中,這個模型反過來說,“這是這部電影的另一個有趣的方面”,“這部電影沒有可取之處”(上圖示例中第三個案例)。

更令人印象深刻的是,在另一項測試中,研究人員使用該系統同時控制句子的多個屬性——包括情緒、時態、聲音等。在對來自多倫多圖書語料庫的200萬段文本片段數據集進行訓練後,該模型能夠將句子從指示性語氣:“John will not survive in the camp”翻譯成條件時態的虛擬語氣:“John couldn 't live in the camp”。

image文本示例:改變句子的多個屬性

研究人員表示:“我們已經證明,我們的模型通過各種實驗和指標有效地反映了條件信息,雖然之前的工作集中在控制單個屬性和改變句子情緒,但是我們所提出的模型很容易擴展到多個屬性場景。在這個框架中考慮具有連續值的屬性,以及更大的語義和語法屬性集將是未來一項有趣的工作。”

原文鏈接:

https://venturebeat.com/2018/12/05/googles-ai-can-change-the-mood-voice-tense-and-sentiment-of-sentences/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章