語音識別對比分析

Android平臺語音識別服務對比分析

一、Google

1、主要功能

提供中英文等多國語言的識別。


2、主要優缺點

主要優點:

語音識別引擎龐大,識別精度很高,適用於文本語音識別。提供多國語言的語音識別。任何平臺都可以進行訪問,容易使用。

主要缺點:

國內可能訪問不太穩定,對中文的識別率相對訊飛可能稍差。


3、使用方法

AndroidAndroid 2.2及後續版本本身提供了可以使用的API接口,使用方式相對簡單,但是其不足是需要依賴於類似於VoiceSearch.apk這樣的應用,這裏面主要完成了音頻錄音,信號檢測,信號降噪等的處理。

當然,從理論上來說,基於Android開源的特性,我們也可以拿到VoiceSearch.apk的源代碼,然後加以分析和改造,將相關代碼集成到我們的應用中,從而達到不依賴於第三方APK而實現語音識別。當然,此種方法理論可行,但是可能有些麻煩。


4、協議條款

Android這邊可以免費使用,不存在什麼條款和限制。


5、代表產品

使用也比較廣泛,比如UCWEB就是採用以依賴第三方APK的方式使用的。



二、科大訊飛

1、主要功能

實現基於HTTP協議的語音應用服務器,支持語音合成、語音聽寫、語音識別、聲紋識別等服務。

提供基於移動平臺和PC上的語音客戶端子系統,內部集成音頻處理和音頻編解碼模塊,提供關於語音合成、語音聽寫、語音識別和聲紋識別完善的API

只需要申請成爲開發者,便可以下載相關的SDK和開發文檔。


2、主要優缺點

主要優點:

支持平臺豐富,各個平臺上都有相應的詳細SDK文檔

語音識別引擎較龐大,對中文的識別精度很高。

主要缺點:

識別引擎位於服務器端,須遠程訪問,識別速度較慢。

對語言支持不如Google,目前僅支持中文聽寫。

當軟件用戶達到百萬次後,需要開始收費。


3、使用方法

1)以控件方式提供開發者使用,此種做法主要是UI不能自己定製,但是使用比較簡單,也不需要依賴第三方APK應用。

2)將底層庫提供給開發者使用,此種做法開發者可以自定義UI,界面風格上會相對靈活。但是以這種方式使用的話具體細節需要和訊飛走商務流程去談。


4、協議條款

具體見訊飛官網。需要注意的就是申請正式的APPID後可以日使用量達到2W次。當用戶達到百萬次後,需要開始收費。


5、代表產品

國內廣泛適用。



三、雲知聲

1、主要功能

雲知聲語音雲讓計算機聽懂人類的語音,將語音中包含的文字信息識別出來。雲知聲語音雲支持大詞彙量連續語音在線識別,支持應用通過API直接調用公有云服務。


2、主要優缺點

鑑於目前國內科大訊飛佔據語音識別的主流地位,雲知聲相對使用較少,優缺點不是太明確。


3、使用方法

1)以控件的方式提供開發者使用

2)以底層API的方式提供開發者使用,需要走商務流程。


4、協議條款

具體見雲知聲官網。需要注意的是雲知聲使用相對限制比較鬆,而且對使用量也沒有限制,直接申請即可。


5、代表產品

搜狗輸入法,觸寶輸入法,微信語音插件。。。



綜合:根據分析和網上資料來看,對於中文識別,訊飛在識別率和使用量等方面,佔有優勢。當然,訊飛語音提供給開發者使用的限制也相對較多,這是其相對開發者使用來說的不足之處。但是鑑於目前我們的用戶規模較小,暫時選擇使用訊飛語音作爲我們的語音服務提供商是可以的,故傾向於在62111929語音輸入部分選用訊飛語音引擎。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章