微信語音輸入不僅僅是懶癌患者的福音

之前分析過微信裏面的一個聲音鎖功能,在登錄微信賬號時可以用聲紋密碼替代字符密碼,說說話就能登錄。筆者從微信推出就開始使用,從塞班時代到安卓、iOS、PC時代,見證着這個APP的5年。

 

我特別想聊聊微信的語音輸入(錄音轉爲文字)功能,咱把語音輸入、圖片、小視頻、紅包等放置的位置稱爲功能面板。從前的版本你可以看到這個面板有個+號,這個面板可以拓展更多的功能,把其他APP加進來。慢慢地,你會看到有些功能沒有了,+號也沒有了,但上了紅包、轉賬、小視頻、卡券。語音輸入,2013年3月份上線,至今將近2年仍佔據功能面板的一席之地。這不禁讓人想知道,它的價值在哪兒?


方便輸入文字,補充微信使用場景

微信因爲主打語音聊天而深入人心,但試想你正在陪同領導開會,雖然不需要發言但總要保持莊重,假如女朋友這時發來語音微信,你哪方便常常拿起手機來聽呢。而女朋友正好在臉上敷黃瓜不方便長時間打字,那她就可以用語音輸入。而你靜靜地看着屏幕就可以啦。儘管還不能識別粵語等方言,但普通話的識別率已經非常高了,這樣聊天法,懶癌患者可該樂開花了。

 

語音聊天(也就是錄音)需要手一直按住“按住說話”按鈕,語音輸入只需要點按一次就能輸出文字,讓你的雙手更空閒。這也是智能語音帶來操作次數減少的便利。

 

醉翁之意,劍指語音交互

現在國內許多應用都已經加了語音輸入,例如:訊飛輸入法,後面百度和搜狗也開始紛紛涉足語音助手產品。百度自主研發,而搜狗也開始自主探索,而微信推出該功能應該感受到這個市場前景,也開始嘗試涉足這個領域。

 

現在我們得區分下兩個“語音”:一個是錄下聲音傳送給朋友聽,一個則是把聲音轉成文字發給朋友看。雖然是呈現的結果很簡單,就是一段錄音、一段文字,實現起來卻不容易。爲了讓用戶能即時聊天,上傳到服務器的錄音大小就需要被壓縮,並保證話質受到較小影響。而語音輸入則牽涉到語音識別,需要此前收集大量的語音數據(包括不同人的、不同口音的、不同環境背景音的等等)來訓練一個大型的數學模型(神經網絡模型),爲之設計更高效的算法,最終才能提高識別率。目前語音產業的普通話識別率普遍在90%以上,行業頂尖的科大訊飛、靈犀雲則是95%。識別率越高需要微信用戶自己修改文字的機會就越少,輸入完請直接點發送,贊贊贊O(∩_∩)O哈!

 

也許目前來看該功能並沒有獲得用戶的青睞,畢竟市面有非常多優秀的輸入法,但騰訊完全可以利用現有微信龐大的用戶羣積累語音數據,有助於提高語音識別率,這爲涉足語音的騰訊,打好了語料積累的堅實基礎。

 

騰訊是在爲以後其他產品做準備,如騰訊語音助手,或者騰訊語音輸入法等等,谷歌、蘋果等國際巨頭高度重視語音交互,騰訊及時跟進,這是大勢所向。說到底,這是騰訊在佈局未來語音交互,迎接無屏幕時代的核心交互方式!


這讓我聯想到2013年另一大事,中移動與語音交互巨頭科大訊飛結成戰略合作伙伴併入股訊飛。爾後共同建設靈犀雲智能語音平臺,爲各色應用提供語音能力。運營商也加入其中!?【吃驚】

 

我想,語音交互將是下一個風口!正如雷布斯的飛豬理論:站在風口上
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章