簡化雲服務的語音檢測算法部署


正文字數:1069  閱讀時長:2分鐘

“在某種程度上,雲服務提供商的語音算法成爲芯片的黑匣子。”


文 / Majeed Ahmad
原文鏈接 /
https://www.edn.com/simplifying-the-deployment-of-voice-detection-algorithms-for-a-cloud-service/


在設計智能音箱和其他語音功能的設備,例如可穿戴設備、可聽覺設備時,開發者面臨的首要挑戰是如何讓麥克風準確有效地檢測 "Alexa "和 "Hey Google "等喚醒詞,以便在雲端處理。


當DSP Group推出支持語音的語音系統級芯片(SoC)DBM10時,EDN向該公司SmartVoice芯片的產品經理Yosi Brosh提出了這個問題。這款基於DSP和神經網絡(NN)加速器的雙核SoC,針對電池設備中的語音和傳感器處理進行了優化,如可聽、可穿戴設備、真正的無線立體聲(TWS)耳機和智能家居遙控器等。


上圖:用於語音智能產品的DBM10芯片宣稱的採用平臺方式,具有全面的軟件框架支持。資料來源:DSP Group


Brosh表示,像亞馬遜網絡服務(AWS)這樣的雲平臺對在芯片上配置寄存器不感興趣。相反,這些雲服務關注的是語音算法如何高效檢測喚醒詞。Brosh說"他們希望算法能夠檢測到喚醒詞,而不需要工程師花費大量時間研究和配置芯片上的寄存器。"


因此,DSP Group開發了一個API,使語音檢測算法很容易集成到雲服務中。他補充道;"在某種程度上,雲服務提供商的語音算法成爲芯片的黑匣子。"


通常的做法是,設備製造商發佈帶有麥克風設置的軟件代碼,並告訴算法提供商如何在麥克風驅動中集成算法。以DSP Group的DBM10芯片爲例,它使用語音固件採集音頻,使語音採集算法的集成變得高效簡單。


DSP Group一直在與十幾家雲公司密切合作,其中包括阿里巴巴、亞馬遜、百度、谷歌和三星,同時在其芯片上移植他們的語音算法。據Brosh介紹,該公司在某些情況下還提供一套完整的軟件。


該芯片能夠爲系統設計人員提供簡單的部署路徑,Brosh表示,公司對運行在DBM10語音接口芯片上軟件的支持一直提供到生產層面,"系統工程師不需要編寫一行代碼"。


這就是爲什麼DSP Group稱其DBM10芯片爲完整解決方案的原因。該SoC通過通用DSP和名爲nNetLite的神經網絡處理器對音頻算法以及傳感AI算法進行了優化。除此以外DSP Group還提供運行在Wi-Fi芯片上用於與DBM10芯片進行通信的額外驅動程序。


SoC還具有跨平臺的工具鏈,支持所有常用的人工智能(AI)和機器學習(ML)框架,以簡化算法部署。工程師們可以開發、訓練和測試算法,然後將算法以標準格式保存,工具鏈會將其提取並創建一個圖像,下載到SoC中。


上圖:nNetLite編譯器可以快速優化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。來源:DSP Group


該SoC的外形尺寸很小,只有4平方毫米,可以進入像智能手錶這樣的極小設備。同樣,在SoC的神經網絡nNetLite引擎上運行的始終處於開啓狀態的wake word算法只消耗幾微瓦的電能。



LiveVideoStackCon 2021 上海站
時間: 2021年4月16日-4月17日

我們準備好全新的內容,在上海歡迎您的到來

點擊【閱讀原文】瞭解更多詳情



本文分享自微信公衆號 - LiveVideoStack(livevideostack)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章