阿里巴巴NLP新進展：隔離場景噪音，提取清晰目標聲音

原創

KYLE WIGGERS

2018-12-03 15:13

阿里巴巴數據科學研究所(Alibaba Institute of Data Science)近期在進行一項研究，該項目希望在嘈雜環境下進行語音識別，比如在擁擠的地鐵系統或會議中心裏，通過隔離噪聲，從而獲得目標對象清晰的聲音。

阿里巴巴的解決方案一部分依靠硬件，一部分靠軟件：通過一個遠場麥克風陣列和複雜的深度學習算法在人羣中隔離聲音，大幅降低錯誤率。

相比之下，“最好”的語音識別技術單靠麥克風陣列才能達到84%的準確率，而阿里巴巴表示，他們的模式準確率在說話人口音很重的情況下，仍可以保持在94%至95%之間。據瞭解，這一技術已經被部署在上海的一個語音地鐵售票系統中，阿里巴巴正在考慮將其推廣到更多城市。

語音並不是阿里巴巴唯一研究的領域。利用自然語言處理，在雲端實時執行自動翻譯，讓來自俄羅斯、馬來西亞等國的阿里巴巴零售客戶可以用母語與客服進行對話，也是阿里巴巴研究的項目之一。阿里巴巴的客服中心每天都會接到數以萬計的呼叫，他們也正在利用算法處理其中的一部分工作，名爲Alime的智能客戶服務引擎就是這一研究的成果。

Alime就像谷歌的Duplex系統一樣，可以進行電話交談，回答基本問題不需要人工參與。在聊天環境中，它還能夠從客戶提供的文檔中自動提取文本和圖像。

自然語言處理技術的應用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市場上，阿里巴巴部署了一款定價機器人，可以與買家談判，以確定價格。

這款機器人的開發並非易事，它需要學習談判策略和有效的生成文本的方法，以激勵反覆談判。但最終取得的效果還是不錯的：應用這款機器人的用戶比其他人的成交率高出20%。

該項目負責人表示：大多數用戶不是專業賣家，不清楚應該如何定價，也不清楚如何與買家溝通，這款機器人可以很好地解決這個問題。

原文鏈接：

https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

阿里巴巴NLP新進展：隔離場景噪音，提取清晰目標聲音

1.6 萬億參數！谷歌訓練一超級人工智能語言模型，相當於9個GPT-3

DeepMind 發佈Acme框架，可簡化強化學習算法開發

谷歌AI可以在75％的情況下預測醫生的處方決定

Facebook的AI從視頻素材中學習物理位置之間的關係

MIT CSAIL新方法：大幅縮小神經網絡規模但不犧牲預測精度，將對遷移學習產生影響

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結