一、前言
又到期末了,課程設計又來了,我打算搞一個簡易版家庭語音助手,然後前幾天在搞百度的語音識別和語音合成,正好今天淘寶買的麥克風到了,我就開始搞拾音部分
關於語音識別和語音合成可參見:
樹莓派 >>> 接入百度AI 開放平臺實現智能語音識別
百度語音合成
二、開始
1)檢查樹莓派是否正確識別麥克風
麥克風插上樹莓派,然後輸入:
lsusb
或者輸入:
arecord -l
可以看到正確識別了。
2)安裝一些輔助軟件
首先更新軟件列表:
sudo apt-get update
然後安裝sox
:
sudo apt-get install sox
其使用可參考:
sox安裝及常用命令
SoX — 音頻處理工具裏的瑞士軍刀
3)錄音
對於arecord 的使用可輸入arecord --help
獲得。
錄音:
arecord -D "plughw:1,0" -f dat -c 1 -r 16000 -d 5 test.wav
這段代碼中:
參數 | 說明 |
---|---|
-D “plughw:1,0” | plughw:1,0的1指的是第一個外部設備,因爲樹莓派內部沒有聲卡,所以只能使用外部的usb麥克風 |
-f dat | 根據幫助手冊中得知,使用這個參數能夠獲得16bit 的編碼 |
-c 1 | 通道數1 |
-r 16000 | 採樣率16k |
-d 5 | 持續(錄音)時間5s |
最後生成的test.wav
文件就是我們的錄音文件
以上參數選擇是根據百度語音識別所需格式配置,大家有其他需求的話,可以自行修改。
tips
大家可以注意到,這裏是使用軟件進行錄音的,要是我們需要在python 代碼中進行錄音的話,可以採用如下方式:
import os
os.system('arecord -D "plughw:1,0" -f dat -c 1 -r 16000 -d 5 test.wav')
三、踩坑
要是大家在錄音的過程中發現錄音質量及其差,噪聲震耳欲聾,請換一下電源,例如把原先供電的排插換成電池等。
這個問題搞了我三個小時,直到我換了一個其他供電方式的樹莓派後。。。
四、結束
百度語音識別,正確識別