用VUI提升用戶體驗

 

VUI簡史

 

談VUi前,得先說GUI。

 

圖像用戶界面GUI(Graphical User Interface)是60年代「人機交互」奇才道格·恩格爾巴特提出的概念,自從80年代蘋果推出第一款應用GUI的電腦後,GUI一直是人機交互的典型代表。

 

隨着越來越多的語音控制設備,VUI開始幫助改進各種不同的用戶體驗。VUI是用戶通過語音與計算機進行人機交互來啓動自動化服務或流程的工具,是直接面向用戶的界面,所以是否能滿足用戶需求是判斷其成功與否的決定性因素之一。

 

VUI的發展過程主要可以分爲以下兩個時期:

 

  • 誕生——純語音交互

 

語音交互界面VUI (Voice User Interface) 並不是全新的概念,它的前身是交互式語音應答IVR(Interractive Voice Response) 。二十世紀九十年代,交互模式的語音應答IVR正式誕生,代表了VUI發展的第一個重要時期。用戶可直接通過電話進入服務中心,利用數字對內部系統進行命令操作。

 

IVR存在的主要缺點有:

 

通常用於單輪任務

交互方式較爲單一

不能進行中途打斷

 

在與系統的交互過程中,如果出現了失誤,用戶只能掛斷重來,這使得整個交互過程極不流暢,而用戶也一直處於相當拘謹的狀態下,與如今語音交互輕鬆自然的氛圍相去甚遠。

 

  • 普及——語音和屏幕結合交互

 

新一代的VUI更多指的是人通過自然語言與計算機進行交互,所以可認爲VUI是人工智能時代下的人機交互代表。

 

各大公司都推出了自己的語音助手,例如微軟的cortana,谷歌的Google OK和蘋果的Siri。這些語音助手結合視覺和聽覺,同時使用語音和屏幕進行人機交互。發展到這個階段,就打破了原先IVR僅能用於單輪任務的侷限性,使得語音交互有了多輪對話的可能性。

 

 

VUI是什麼?

 

作爲新一代的交互模式,通俗的說,VUI(語音用戶界面)就是用人類最自然的語言(開口說話)給機器下達指令,達成自己的目的的過程,這一過程包括三個環節:

 

  • 能聽

  • 會說

  • 懂你

 

VUI是用戶通過語音或者語音平臺與計算機進行人機交互,來啓動自動化服務或流程。VUI設計,即用戶與語音應用系統的交互設計。VUI是直接面向用戶的界面,所以是否能滿足用戶需求是系統成功與否的決定性因素之一。

 

最典型的應用就是語音助手,當下最熱門的產品就是智能音箱了。


 

什麼場景適合使用語音交互?

 

1.智能家居:在家庭“相對封閉與安全”(特指針對語音信號採集的干擾程度),通過語音交互指令控制家居開關是很好的切入點。相信在不久的將來,搭載了語音交互系統的智能家居,都可以聽你的話,你說所說的每個指令,都會直接影響/控制到當前家居的運行狀態。“你可能越來越愜意,也可能越來越懶......”

 

2.出行車載語音交互系統:釋放了駕駛員的手和眼,讓司機專注於前方的路況,如接聽電話、開關車窗、播放廣播音樂、路線導航等語音交互指令。

 

3.企業應用:未來會有各種各樣專業的知識工作者會在或大或小的程度被簡化或者被替代,比如文本、數據的錄入工作,比如客服機器人。但,極不太可能的是直接對着一個設備吼兩嗓子做一個PPT的方式。

 

4.醫療&教育:如語音記錄病歷,不管對醫生來說還是患者來說,都是提高看病效率的很好的輔助手段之一。

 

 

語音用戶界面(VUI)的設計原則

 

 

  • 不要讓用戶有認知負荷

聲音對於人類來說是短暫的記憶,人們不可能一下子記住很多新信息。所以不要挑戰人類短暫的記憶能力。

 

  • 準確、高效

抓住用戶的主要需求,準確、快速的讓用戶達到自己的目標。

 

  • 消除歧義

當系統問用戶,你的主要症狀是什麼?而用戶說的是發燒和感冒,系統就要理解用戶說的是兩個症狀,針對這個事情,系統需要進行回覆兩種不同的症狀解決方式。

 

  • 對話喚起

信息和用戶界面組件必須以可感知的方式呈現給用戶。

 

  • 無障礙設計

創建可用不同方式呈現的內容(例如簡單的佈局),而不會丟失信息或結構。

 

  • 不要責怪用戶

提供幫助用戶導航、查找內容、並確定其位置的方法。

 

 

語音交互涉及那些技術

 

VUI(語音用戶界面)所涉及的技術模塊有 4 個部分,分別爲:

 

自動語音識別:Automatic Speech Recognition, ASR

 

自然語言理解:Natural Language Understanding, NLU

 

自然語言生成:Natural Language Generation, NLG

 

文字轉語音:Text to Speech, TTS

 

 

 

語音交互技術包括的識別、理解和對話三個部分。也就是通過麥克風讓機器能聽到用戶說的話,然後聽懂用戶想要表達的意思,並把反饋的結果“說給用戶聽”。

 

 

 

VUI 設計師的工作內容

 

VUI 設計和普通的互聯網的設計沒有太多的不一樣,如果非要說區別的話,我個人認爲 VUI 設計所接觸和涉及的範圍更廣。主要有下面幾個工作內容:

 

進行用戶研究,瞭解用戶是誰,哪裏的用戶(環境),以及在系統和終端之間從開始到結束的整個對話過程;

 

負責產品的原型設計(原型設計工具Mockplus)和產品描述,描述系統與用戶之間的交互行爲。

 

描述系統與用戶之間的交互行爲並考慮需要處理的請求,通過分析數據來了解系統在什麼地方發生了問題,最後進行系統問題的排查和改進。

 

 

如何更好的理解用戶想做什麼

 

 

動手設計之前,有經驗的 VUI 設計師會先解構該預設行爲。通常,用戶的一個語音指令會包含三個關鍵因素:意圖、表達方式、特殊要求。

 

 

  • 意圖

 

a. 明確意圖:語音指令是一個具體的要求,如 “開/關燈,放音樂,查天氣,等等。

 

b. 模糊意圖:語音指令比較模糊,可能指向多結果。如用戶直接說 “好妹妹”,結果可能導向1)好妹妹樂隊的音樂 2)好妹妹電臺 3)通訊錄聯繫人 4)設備暱稱(誤)。在還沒有用戶使用習慣的數據時,就需要補問用戶,從而更好地理解和反饋。

 

 

  • 表達方式

 

比如用戶想要播放音樂,他可能會說“Hey Cortana, Play chill music on Spotify" 也可能會說 “Hey Cortana, I wannahear chill music"

 

VUI設計需要考慮到指令的各種表達方式,這會幫助人工智能有效的反饋正確的結果。

 

 

  • 特殊要求

 

“Hey Cortana, play (chill) music on (Spotify)"

 

“Uber me to home at (6 p.m)"

 

上邊例句中,括號內均爲該指令的特殊要求。(放鬆)或(激情)的音樂;

 

(Spotify)或(iHeatradio)作音樂提供商;(下午6點)或(下午7點)打車。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章