[音視頻][語音識別][ffmpeg] 提取視頻中音頻並識別成文字

1. windows安裝ffmpeg

下載ffmpeg的windows版本https://ffmpeg.zeranoe.com/builds/

網盤

解壓,配置環境變量

 

2. 使用ffmpeg命令提取pcm音頻

ffmpeg -y -i C:\Users\Administrator\Desktop\7fb7d449010e270064b2b7b305109a29.mp4 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 ./111222/test.pcm

 

 

3. 使用訊飛進行pcm語音識別

https://www.xfyun.cn/doc/asr/voicedictation/API.html#%E6%8E%A5%E5%8F%A3%E8%AF%B4%E6%98%8E

 

4. 新建spring工程,運行

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章