環境:使用的IDE是Pycharm
1.新建工程
2.配置百度語音識別環境
“File”——“Settings”打開設置面板,“Project”標籤下添加Project Interpreter,點擊右側“+”
輸入“baidu-aip”,進行安裝
新建測試文件
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '******'
API_KEY = '******'
SECRET_KEY = '******'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 讀取文件
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
# 識別本地文件
test1 = client.asr(get_file_content('test.pcm'), 'pcm', 16000, {'dev_pid': 1536,})
print(test1)
注意:提交的音頻文件格式推薦是PCM,採樣率16K,16位,單聲道。
轉換的文字準確率還是可以的,但是沒有標點符號,這一點比較不滿意:
{'corpus_no': '6670746770877419029', 'err_msg': 'success.', 'err_no': 0, 'result': ['這裏是語音轉換的結果看不到標點符號'], 'sn': '29336209551553154264'}