AWS想到辦法讓Alexa能在毫秒內做出回覆

隨着語音助理的技能越來越多樣化,要處理的任務也越來越複雜,Amazon爲了能讓Alexa在更短的時間內,處理並完成複雜的任務,AmazonAlexa AI團隊近日在美國AI協會舉辦的第33屆研討會中,發表了一篇關於壓縮神經網絡的論文,透過壓縮詞向量表的新方法,在儘可能不影響準確度的情況下,將神經網絡縮小90%,使Alexa在處理複雜的任務時,也能在毫秒內給予正確的迴應,也讓Alexa能夠持續擴展新技能。語音助理Alexa目前支持超過70,000種第三方的技能,每個月以數個技能在增加,因此,壓縮神經網絡是必要的方法,來使這些技能的自然語言理解模型,更有效地儲存,在自然語言理解應用中,大多數的神經網絡的大小都是來自於巨大的查詢表(lookup table),該查詢表會用詞向量(word embedding),記錄輸入文字的相互關聯性,詞向量通常是一個包含300個數的龐大序列,來抓取字詞意義的信息,而神經網絡被應用於許多AI系統中,但是其一特性就是規模非常大,也意味着執行速度緩慢,對於像是Alexa這種需要實時處理口語請求並給予回覆的語音助理系統,是個很大的問題。
AWS想到辦法讓Alexa能在毫秒內做出回覆
在Amazon研究團隊的實驗中,Amazon利用一套預先訓練的詞向量Glove,Glove與其他熱門的詞向量一樣,用大量的訓練數據與詞語進行比對,在一個300維度空間中,以一個點表示該詞語,相似的詞會被歸類在同一羣中,通常自然語言理解系統會利用這種預先訓練的詞向量,因爲可以產生跨概念的相關詞彙,舉例來說,能夠讓語音助理透過關聯性,理解較爲少見的指令。過去自然語言理解研究員都會用包含10萬個詞的龐大查詢表,將詞向量表的300維度縮減爲30,並用較小的詞向量作爲自然語言理解系統的輸入數據,Amazon研究團隊則是將詞向量表整合至神經網絡,如此一來,就能夠用特定任務的訓練數據,來優化詞向量。爲了降低詞向量的維度,Amazon採用奇異值分解(singular-value decomposition),在較高維度的空間產生較低維度的投影,該方法類似於在三維空間中針對物體產生二維投影,在其中一項實驗中,Amazon研究團隊開發的系統能夠將神經網絡縮小90%,同時網絡模型的準確度只有減少不到1%,在相同的壓縮率之下,過去研究最佳的結果是準確度約下降3.5%。部分信息參考:http://www.cafes.org.tw/info.asp
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章