唤醒词检测引擎Snowboy

Snowboy 是一款高度可定制的唤醒词检测引擎(例如百度的语音唤醒“小度小度”,就是基于它。),可以用于实时嵌入式系统,并且始终监听(即使离线)。当前,它可以运在 Raspberry Pi、(Ubuntu)Linux 和 Mac OS X 系统上。

官网: https://snowboy.kitt.ai/   

github :https://github.com/kitt-ai/snowboy

文档介绍 :http://docs.kitt.ai/snowboy/

  一些热门的唤醒词包括,Amazon Echo 上的“Alexa”,Android 设备上的“OK Google” 和 iPhone 上的“Hey Siri”。这些唤醒词用于,发起一个完整的语音交互界面。除了此,唤醒词还可以用于其他用途,比如执行简单的命令和控制动作。

  在一个棘手的解决方案中,它可以运行完整的自动语音识别(ASR,Automatic Speech Recognition)来执行热词检测。在这种情况下,设备将在自动语音识别转录中观察特定的触发词。转录中观察特定的触发词。 另外,当使用基于云的解决方案时,它也不会保护您的隐私。幸运的是,Snowboy 被创造出来,解决这些问题。

Snowboy 具有以下的特性:

  • 高度可定制。允许您自由定义自己的魔术词,如(但不限于)“芝麻开门”(open sesame)、“打开车库门”(garage door open)、或者“你好,梦之屋”(hello dreamhouse)。你能想到的,你就能定制它。
  • 一直监听,但是保护您的隐私。因为 Snowboy 没有连接到网络,因此不需要将你的声音上传到任何地方。
  • 轻巧的、可嵌入,可以让您在 Raspberry Pi 上运行。在最小的Pi(单核700M Hz ARMv6)上消耗少于10%的CPU。
  • Apache 协议

当前,Snowboy 可以支持:

  • 所有的 Raspberry Pi (搭载 Debian Jessie 8.0)
  • 64位 Mac OS X
  • 64bit Ubuntu (12.04 和 14.04)
  • iOS
  • Android (ARMv7 CPU)
  • Pine 64,搭载 Debian Jessie 8.5 (内核版本 3.10.102)
  • Intel Edison,搭载 Ubilinux (Debian Wheezy 7.8)
  •  

一、前期准备

  1、一个支持 Snowboy,并带有麦克风的设备;

  2、一个训练好的模型,可以从 https://snowboy.kitt.ai/dashboard 获取,可以自己训练,也可以下载训练好的模型,但是下载的时候,需要自己录入自己的语音。

 

二、下载Snowboy

  您可以下载预先打包好的 Snowboy 二进制文件,及其 Python 封装:

  下载地址:1/2/3/Zero

  或者在GitHub上下载编译

三、访问麦克风

  在这里,我们使用 PortAudio 作为音频输入/输出的跨平台支持。我们还使用 sox 作为快速实用程序,来检查麦克风设置是否正确。因此,我们需要先安装这个软件,使用麦克风。

1、安装 Sox

shell>sudo apt-get install sox

2、安装Python的pyaudio模块

shell>pip install pyaudio

 

四、运行DEMO

  该 DEMO 可以在任何设备上运行。但是我们建议您:在带有扬声器输出的笔记本电脑/台式机上运行它,因为当您的唤醒词被触发时,DEMO 会播放Ding声音。

shell> python demo.py snowboy.pmdl

配置链接:https://www.jianshu.com/p/a69142ff63f3

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章