向夢想出發 - 搭建ROS下的語音助手

        有一段時間沒更新博客了,這段時間一直在開發機器人的語音功能,目前,功能已經開發差不多了,所以就寫個博客記錄一下。

        我這個語音助手類似於siri或者小冰的功能,你可以跟他對話也可以問他問題,他都能回答你,或者可以自定義一些命令,他識別以後執行特定的操作。他還可以講中英文還有各種方言,還能把你說的中文翻譯成英文並說出來。

        功能看似很強大,但核心的東西都是調其他公司的開放接口實現的,我所做的就是把他們這些功能用ROS的框架整合起來,通過定義各種消息來協調不同的功能,最終實現一個語音助手或聊天機器人的功能。因爲要調用第三方公司的接口,所以,這個要依賴網絡。我也查了一些開源的語音識別庫的資料,但效果都不好,比如MCUSphinx,識別率很低,而且中文很慢,也可能是我還不太會用的緣故吧。不管怎麼說,要依賴網絡和第三方公司接口,總感覺會受限制,不是很理想。如果實用的話,還會有隱私泄漏的問題。訊飛的離線識別模塊,只適用商業產品,不適用我這個純愛好的東西,不過我相信過不了多久就會有效果非常好且免費的離線語音識別供大家使用的。

        ROS語音助手我在樹莓派上也運行成功了,麥克風選用的是respeaker的一個6麥克的模塊,音頻輸出採用的是音頻放大加喇叭的模塊,優優機器人主的語音功能基本就這些了,以後再根據需要添加一些自定義語音命令就行了。接下來就可以開始開發機器視覺相關的功能了。貼一張語音助手的ROS消息節點圖:



測試視頻地址:

http://www.iqiyi.com/w_19rtwkdw85.html

http://www.iqiyi.com/w_19rtwj8d5t.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章