简化云服务的语音检测算法部署

原創

原创

2021-03-29 21:08

正文字数：1069 阅读时长：2分钟

“在某种程度上，云服务提供商的语音算法成为芯片的黑匣子。”

文 / Majeed Ahmad

原文链接 /

https://www.edn.com/simplifying-the-deployment-of-voice-detection-algorithms-for-a-cloud-service/

在设计智能音箱和其他语音功能的设备，例如可穿戴设备、可听觉设备时，开发者面临的首要挑战是如何让麦克风准确有效地检测 "Alexa "和 "Hey Google "等唤醒词，以便在云端处理。

当DSP Group推出支持语音的语音系统级芯片(SoC)DBM10时，EDN向该公司SmartVoice芯片的产品经理Yosi Brosh提出了这个问题。这款基于DSP和神经网络(NN)加速器的双核SoC，针对电池设备中的语音和传感器处理进行了优化，如可听、可穿戴设备、真正的无线立体声(TWS)耳机和智能家居遥控器等。

上图：用于语音智能产品的DBM10芯片宣称的采用平台方式，具有全面的软件框架支持。资料来源：DSP Group

Brosh表示，像亚马逊网络服务(AWS)这样的云平台对在芯片上配置寄存器不感兴趣。相反，这些云服务关注的是语音算法如何高效检测唤醒词。Brosh说"他们希望算法能够检测到唤醒词，而不需要工程师花费大量时间研究和配置芯片上的寄存器。"

因此，DSP Group开发了一个API，使语音检测算法很容易集成到云服务中。他补充道；"在某种程度上，云服务提供商的语音算法成为芯片的黑匣子。"

通常的做法是，设备制造商发布带有麦克风设置的软件代码，并告诉算法提供商如何在麦克风驱动中集成算法。以DSP Group的DBM10芯片为例，它使用语音固件采集音频，使语音采集算法的集成变得高效简单。

DSP Group一直在与十几家云公司密切合作，其中包括阿里巴巴、亚马逊、百度、谷歌和三星，同时在其芯片上移植他们的语音算法。据Brosh介绍，该公司在某些情况下还提供一套完整的软件。

该芯片能够为系统设计人员提供简单的部署路径，Brosh表示，公司对运行在DBM10语音接口芯片上软件的支持一直提供到生产层面，"系统工程师不需要编写一行代码"。

这就是为什么DSP Group称其DBM10芯片为完整解决方案的原因。该SoC通过通用DSP和名为nNetLite的神经网络处理器对音频算法以及传感AI算法进行了优化。除此以外DSP Group还提供运行在Wi-Fi芯片上用于与DBM10芯片进行通信的额外驱动程序。

SoC还具有跨平台的工具链，支持所有常用的人工智能（AI）和机器学习（ML）框架，以简化算法部署。工程师们可以开发、训练和测试算法，然后将算法以标准格式保存，工具链会将其提取并创建一个图像，下载到SoC中。

上图：nNetLite编译器可以快速优化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。来源：DSP Group

该SoC的外形尺寸很小，只有4平方毫米，可以进入像智能手表这样的极小设备。同样，在SoC的神经网络nNetLite引擎上运行的始终处于开启状态的wake word算法只消耗几微瓦的电能。

LiveVideoStackCon 2021 上海站

时间： 2021年4月16日-4月17日

我们准备好全新的内容，在上海欢迎您的到来

点击【阅读原文】了解更多详情

本文分享自微信公众号 - LiveVideoStack（livevideostack）。
如有侵权，请联系 [email protected] 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

简化云服务的语音检测算法部署

MySQL查出時間比實際晚8小時的解決方案

什麼是IPD項目管理模式？聊聊IPD下的產品研發流程

aaaaaa1

Java編程工具：簡潔高效實現

Java word通過html設置樣式（Spire Docx）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結