阿里巴巴NLP新進展:隔離場景噪音,提取清晰目標聲音

阿里巴巴數據科學研究所(Alibaba Institute of Data Science)近期在進行一項研究,該項目希望在嘈雜環境下進行語音識別,比如在擁擠的地鐵系統或會議中心裏,通過隔離噪聲,從而獲得目標對象清晰的聲音。

阿里巴巴的解決方案一部分依靠硬件,一部分靠軟件:通過一個遠場麥克風陣列和複雜的深度學習算法在人羣中隔離聲音,大幅降低錯誤率。

相比之下,“最好”的語音識別技術單靠麥克風陣列才能達到84%的準確率,而阿里巴巴表示,他們的模式準確率在說話人口音很重的情況下,仍可以保持在94%至95%之間。據瞭解,這一技術已經被部署在上海的一個語音地鐵售票系統中,阿里巴巴正在考慮將其推廣到更多城市。

語音並不是阿里巴巴唯一研究的領域。利用自然語言處理,在雲端實時執行自動翻譯,讓來自俄羅斯、馬來西亞等國的阿里巴巴零售客戶可以用母語與客服進行對話,也是阿里巴巴研究的項目之一。阿里巴巴的客服中心每天都會接到數以萬計的呼叫,他們也正在利用算法處理其中的一部分工作,名爲Alime的智能客戶服務引擎就是這一研究的成果。

Alime就像谷歌的Duplex系統一樣,可以進行電話交談,回答基本問題不需要人工參與。在聊天環境中,它還能夠從客戶提供的文檔中自動提取文本和圖像。

自然語言處理技術的應用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市場上,阿里巴巴部署了一款定價機器人,可以與買家談判,以確定價格。

這款機器人的開發並非易事,它需要學習談判策略和有效的生成文本的方法,以激勵反覆談判。但最終取得的效果還是不錯的:應用這款機器人的用戶比其他人的成交率高出20%。

該項目負責人表示:大多數用戶不是專業賣家,不清楚應該如何定價,也不清楚如何與買家溝通,這款機器人可以很好地解決這個問題。

原文鏈接:

https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章