百度新突破:AI同聲傳譯系統STACL,可預測,低延遲

編譯:chux

出品:ATYUN訂閱號

百度開發了新的AI系統,名爲同聲傳譯和預期與可控延遲(STACL),百度聲稱這代表了自然語言處理的重大突破。

與大多數AI翻譯系統不同,STACL能夠在演講者講話後幾秒鐘開始翻譯,並在句子結束後幾秒鐘內完成翻譯。它與連續解釋相反,翻譯器等待,直到說話者暫停開始翻譯。

百度表示,它通過在人工翻譯之後對系統進行建模來應對挑戰。STACL直接預測翻譯中的目標語言單詞,並將翻譯和預期融合到單個模型中,“wait-k”,即總是翻譯說話者語音後面的k個單詞以允許預測上下文。系統經過訓練,使用源句子的可用前綴來決定翻譯中的下一個單詞。

以下是百度解釋的方式:

在例子Bùshí Zǒngtǒng zài Mòsīkē(布什總統在莫斯科)和英譯“President Bush”中,ķ=2,2個詞落後於中文,我們的系統準確地預測,下一個翻譯的單詞必須是“會見”,因爲布什很可能在莫斯科會見某人(例如普京),早在中文動詞出現之前。

STACL的另一個關鍵優勢是延遲靈活性。它可以設置得更低或更高,取決於兩種語言的相關程度,例如,法語和西班牙語較低,英語和中文等遠程語言較高,或英語和德語等不同單詞順序的語言較高。

“翻譯質量更常見的是低延遲要求,但與傳統的全句(例如非同步)翻譯相比,我們的系統在質量上只有很小的損失,”百度寫道,“考慮到低延遲要求,我們將繼續提高翻譯質量。”

那麼STACL與人類口譯員相比如何呢?根據百度的說法,它比傳統的全句翻譯少了3.4個BLEU點(“雙語評估替補”的縮寫,是評估機器翻譯文本的標準指標)。在中英文同聲傳譯中,AI系統落後於中文語音大約三秒鐘,翻譯質量比全句(非同步)翻譯低3.4個BLEU點。

“即使有最新進展,我們也完全瞭解同步機器翻譯系統的諸多限制,”百度寫道,“STACL的發佈並不是要取代人類口譯員,他們將在未來許多年繼續依賴他們的專業服務,而是讓同步翻譯更容易獲得。”

STACL推進了該公司早期的語音識別工作,更廣泛地說,是AI相關工作。在2016年和2017年,百度推出SwiftScribe,一個Web應用程序搭載了DeepSpeech平臺,TalkType分別聽寫爲中心的Android鍵盤。最近,在7月,它推出了定製設計的AI芯片,崑崙AI,用於邊緣和雲計算,以及百度腦3.0,一套110種AI服務,從自然語言處理到計算機視覺。

百度不是唯一一家在AI翻譯和轉錄方面掀起波瀾的公司。微軟在3月展示了一個系統,該系統在將新聞從中文翻譯成英文時與人類表現相匹配。Facebook已經開始利用無監督的機器學習將內容從一種語言翻譯成另一種語言。多倫多大學的研究人員開發了一種離線語音識別模型,其準確率爲97%。

論文:arxiv.org/abs/1810.08398

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章