使用python和IBM speech to text 進行語音識別

原創

tang20120235

2020-02-23 22:07

wav 轉 text ，感覺還是IBM 的 speech to text 比較靠得住。

比百度的語音識別API好上太多。

https://speech-to-text-demo.mybluemix.net/

--------------------------------------------------------------------

註冊拿到帳號密碼後，

有一個包比較方便調用

是SpeechRecogntion

https://pypi.python.org/pypi/SpeechRecognition/

pip install 或者按照說明安裝就行了

---------------------------------------------------------------------

SpeechRecognition包含多個網站的API

然而Google的並不能用，AT&T的沒試過。

--------------------------------------------------------------------

在debian 上測試的時候有個問題，需要管理員權限。

可能是內部有過wav 2 flac 然後把臨時文件保存在dist-package下了，

--------------------------------------------------------------------

SpeechRecognition有示例代碼wav_transcribe.py；

如果用於識別中文，需要在speechrecognition/__init__.py中，

修改recognize_ibm函數的482行

assert language in ["en-US", "es-ES", "ja-JP"], "`language` must be a valid language."

增加"zh-CN"項，

assert language in ["en-US", "es-ES", "ja-JP", "zh-CN"], "`language` must be a valid language."

---------------------------------------------------------------------

SpeechRecognition的用法如下

import speech_recognition as sr

讀wav文件

r = sr.Recognizer()
with sr.WavFile(path) as source:
    audio = r.record(source)

然後可以調用 recognize_ibm 返回識別結果，是utf8格式的，一般寫起來會有些問題

IBM_USERNAME = 'XXXXXXXX'
IBM_PASSWORD= 'XXXXXXXX'

text = r.recognize_ibm(audio, username = IBM_USERNAME, password = IBM_PASSWORD, language = 'zh-CN')

text 就是識別結果，可能會有編碼問題之類的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

使用python和IBM speech to text 進行語音識別

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

大齡程序員思考

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

nuget添加readme

安裝Spynner依賴庫記錄

關閉IPV6，ubuntu 14.04

[重裝系統系列]fcitx 小企鵝輸入法安裝 in ubuntu 15.04

[系統維護] ubuntu 14.04 LTS X64，自帶無線網卡 RTL8188EE 驅動不穩定問題

使用python和IBM speech to text 進行語音識別

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

使用python和IBM speech to text 進行 語音識別

使用python和IBM speech to text 進行語音識別