錄音轉文字SDK哪家強?

最近在做一款錄音App,有一個模塊是錄音轉文字功能,於是對比了市面上常見的API,國內做的比較大的主要有訊飛、騰訊、阿里、百度、華爲。

訊飛

訊飛在國內做語音SDK是做的比較早的,翻譯出來的準確率挺不錯的,支持的方言也多,比較成熟。只是價格上比較貴,感覺是最貴的API了,適合對轉寫要求比較高的用戶。
SDK有個缺點就是不能直接給OSS地址,調用他家的SDK必須要上傳音頻文件。

一共有6種套餐,我給大家介紹其中兩種:

套餐三:

1000小時3900元,相當於一小時3.9元,贈送3個方言/語種,使用有效期一年。

套餐六:

10萬小時12萬元,相當於一小時1.2元,贈送8個方言/語種,使用有效期一年。

他們官網介紹地址:

https://www.xfyun.cn/services/lfasr

騰訊

騰訊依託微信的用戶羣體,語音轉文字也是做的挺不錯的,翻譯的也很準確,標點符號都能翻譯出來,客服服務也好,你問了問題立馬打電話給你,SDK調試也方便,有在線調試網頁。

支持5小時以內的錄音文件進行識別,文件大小不超過512MB,異步返回識別全部結果。識別結果在服務端可保存7天。方言也支持幾十種。

他們家分付費跟預付費兩種。

預付費,就是購買資源包,有效期是1年

最貴套餐,30萬小時,21萬人名幣,一個小時0.7元

後付費,就是先使用再付費

一個月使用量是30萬小時以上,一個小時是0.95元

感覺購買資源包比較划算,搞活動的時候,資源包能便宜到0.6元一個小時。

他們官網介紹地址以及計費說明:

https://cloud.tencent.com/document/product/1093/35686

華爲

華爲的我沒有使用過SDK,官網也沒有介紹支持的方言,文件大小限制,轉寫時間什麼的。

華爲就是按照小時計費的,最貴的套餐:

20萬小時,20萬人名幣,1塊錢1小時,有效期是一年。

他們官網介紹地址以及計費說明:

https://support.huaweicloud.com/productdesc-sis/sis_01_0020.html

阿里雲

做的挺專業的,支持的語種也很多,中國國內語言32種(普通話+方言),國外語言32種。他們家分付費跟預付費兩種。

預付費,就是購買資源包,有效期是1年

最貴套餐,25萬小時,20萬人名幣,一個小時0.8元

後付費,就是先使用再付費

一個月使用量5000小時以上,一個小時是1.2元

他們官網介紹地址以及計費說明:

https://help.aliyun.com/document_detail/207373.html

百度

百度音頻文件轉寫目前支持的語言有中文普通話和英語。

預付費,就是購買資源包,有效期是1年

最貴套餐,50萬小時,30萬人名幣,一個小時0.6元

後付費,就是先使用再付費

沒有使用量的說法,就是一個小時2塊錢

他們官網介紹地址以及計費說明:

https://ai.baidu.com/tech/speech

最後總結

從識別準確率、套餐價格、支持語種來說,個人覺得最適合的SDk是阿里跟騰訊,我自己的App也是接的騰訊雲,有時間打算把阿里雲也接入進來。這樣可以兩家SDK切換使用。

我自己開發的App名字叫:「楚少錄音」,已上架各大應用商店,歡迎大家去體驗下載,目前有錄音、視頻轉文字、文字轉語音(智能配音)、音頻裁剪、音頻合併、格式轉換、音頻裁剪、音頻降噪等功能。

首頁

官網:

https://luyin.art

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章