最近在做一款錄音App,有一個模塊是錄音轉文字功能,於是對比了市面上常見的API,國內做的比較大的主要有訊飛、騰訊、阿里、百度、華爲。
訊飛
訊飛在國內做語音SDK是做的比較早的,翻譯出來的準確率挺不錯的,支持的方言也多,比較成熟。只是價格上比較貴,感覺是最貴的API了,適合對轉寫要求比較高的用戶。
SDK有個缺點就是不能直接給OSS地址,調用他家的SDK必須要上傳音頻文件。
一共有6種套餐,我給大家介紹其中兩種:
套餐三:
1000小時3900元,相當於一小時3.9元,贈送3個方言/語種,使用有效期一年。
套餐六:
10萬小時12萬元,相當於一小時1.2元,贈送8個方言/語種,使用有效期一年。
他們官網介紹地址:
騰訊
騰訊依託微信的用戶羣體,語音轉文字也是做的挺不錯的,翻譯的也很準確,標點符號都能翻譯出來,客服服務也好,你問了問題立馬打電話給你,SDK調試也方便,有在線調試網頁。
支持5小時以內的錄音文件進行識別,文件大小不超過512MB,異步返回識別全部結果。識別結果在服務端可保存7天。方言也支持幾十種。
他們家分付費跟預付費兩種。
預付費,就是購買資源包,有效期是1年
最貴套餐,30萬小時,21萬人名幣,一個小時0.7元
後付費,就是先使用再付費
一個月使用量是30萬小時以上,一個小時是0.95元
感覺購買資源包比較划算,搞活動的時候,資源包能便宜到0.6元一個小時。
他們官網介紹地址以及計費說明:
華爲
華爲的我沒有使用過SDK,官網也沒有介紹支持的方言,文件大小限制,轉寫時間什麼的。
華爲就是按照小時計費的,最貴的套餐:
20萬小時,20萬人名幣,1塊錢1小時,有效期是一年。
他們官網介紹地址以及計費說明:
https://support.huaweicloud.com/productdesc-sis/sis_01_0020.html
阿里雲
做的挺專業的,支持的語種也很多,中國國內語言32種(普通話+方言),國外語言32種。他們家分付費跟預付費兩種。
預付費,就是購買資源包,有效期是1年
最貴套餐,25萬小時,20萬人名幣,一個小時0.8元
後付費,就是先使用再付費
一個月使用量5000小時以上,一個小時是1.2元
他們官網介紹地址以及計費說明:
百度
百度音頻文件轉寫目前支持的語言有中文普通話和英語。
預付費,就是購買資源包,有效期是1年
最貴套餐,50萬小時,30萬人名幣,一個小時0.6元
後付費,就是先使用再付費
沒有使用量的說法,就是一個小時2塊錢
他們官網介紹地址以及計費說明:
最後總結
從識別準確率、套餐價格、支持語種來說,個人覺得最適合的SDk是阿里跟騰訊,我自己的App也是接的騰訊雲,有時間打算把阿里雲也接入進來。這樣可以兩家SDK切換使用。
我自己開發的App名字叫:「楚少錄音」,已上架各大應用商店,歡迎大家去體驗下載,目前有錄音、視頻轉文字、文字轉語音(智能配音)、音頻裁剪、音頻合併、格式轉換、音頻裁剪、音頻降噪等功能。
官網: