微信語音輸入不僅僅是懶癌患者的福音

原創

2018-09-03 01:26

之前分析過微信裏面的一個聲音鎖功能，在登錄微信賬號時可以用聲紋密碼替代字符密碼，說說話就能登錄。筆者從微信推出就開始使用，從塞班時代到安卓、iOS、PC時代，見證着這個APP的5年。

我特別想聊聊微信的語音輸入（錄音轉爲文字）功能，咱把語音輸入、圖片、小視頻、紅包等放置的位置稱爲功能面板。從前的版本你可以看到這個面板有個+號，這個面板可以拓展更多的功能，把其他APP加進來。慢慢地，你會看到有些功能沒有了，+號也沒有了，但上了紅包、轉賬、小視頻、卡券。語音輸入，2013年3月份上線，至今將近2年仍佔據功能面板的一席之地。這不禁讓人想知道，它的價值在哪兒？

方便輸入文字，補充微信使用場景

微信因爲主打語音聊天而深入人心，但試想你正在陪同領導開會，雖然不需要發言但總要保持莊重，假如女朋友這時發來語音微信，你哪方便常常拿起手機來聽呢。而女朋友正好在臉上敷黃瓜不方便長時間打字，那她就可以用語音輸入。而你靜靜地看着屏幕就可以啦。儘管還不能識別粵語等方言，但普通話的識別率已經非常高了，這樣聊天法，懶癌患者可該樂開花了。

語音聊天（也就是錄音）需要手一直按住“按住說話”按鈕，語音輸入只需要點按一次就能輸出文字，讓你的雙手更空閒。這也是智能語音帶來操作次數減少的便利。

醉翁之意，劍指語音交互

現在國內許多應用都已經加了語音輸入，例如：訊飛輸入法，後面百度和搜狗也開始紛紛涉足語音助手產品。百度自主研發，而搜狗也開始自主探索，而微信推出該功能應該感受到這個市場前景，也開始嘗試涉足這個領域。

現在我們得區分下兩個“語音”：一個是錄下聲音傳送給朋友聽，一個則是把聲音轉成文字發給朋友看。雖然是呈現的結果很簡單，就是一段錄音、一段文字，實現起來卻不容易。爲了讓用戶能即時聊天，上傳到服務器的錄音大小就需要被壓縮，並保證話質受到較小影響。而語音輸入則牽涉到語音識別，需要此前收集大量的語音數據（包括不同人的、不同口音的、不同環境背景音的等等）來訓練一個大型的數學模型（神經網絡模型），爲之設計更高效的算法，最終才能提高識別率。目前語音產業的普通話識別率普遍在90%以上，行業頂尖的科大訊飛、靈犀雲則是95%。識別率越高需要微信用戶自己修改文字的機會就越少，輸入完請直接點發送，贊贊贊O(∩_∩)O哈！

也許目前來看該功能並沒有獲得用戶的青睞，畢竟市面有非常多優秀的輸入法，但騰訊完全可以利用現有微信龐大的用戶羣積累語音數據，有助於提高語音識別率，這爲涉足語音的騰訊，打好了語料積累的堅實基礎。

騰訊是在爲以後其他產品做準備，如騰訊語音助手，或者騰訊語音輸入法等等，谷歌、蘋果等國際巨頭高度重視語音交互，騰訊及時跟進，這是大勢所向。說到底，這是騰訊在佈局未來語音交互，迎接無屏幕時代的核心交互方式！

這讓我聯想到2013年另一大事，中移動與語音交互巨頭科大訊飛結成戰略合作伙伴併入股訊飛。爾後共同建設靈犀雲智能語音平臺，爲各色應用提供語音能力。運營商也加入其中！？【吃驚】

我想，語音交互將是下一個風口！正如雷布斯的飛豬理論：站在風口上

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

微信語音輸入不僅僅是懶癌患者的福音

方便輸入文字，補充微信使用場景

醉翁之意，劍指語音交互

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

【犀利評】看完你能樂得多喫一碗飯

【分享】一個語音Java SDK使用的常見問題解答

依照目前的趨勢，人類也許能用智能設備武裝到牙齒

盤點國內外最受關注的智能音箱（下）

微信語音輸入不僅僅是懶癌患者的福音

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結