一步一步教你做可用性測試 一、介紹 二、步驟

最好的輸入就是輸出,最近進行了一次可用性測試的分享。分享會上和大家交流,瞭解了一些實操過程中的重要點,大多是網上沒有的資料,是一些寶貴的經驗:

1、正式測試時,單個任務的時間怎麼計算。一個測試者需要完成3-5個任務,一個任務一個卡片,一次發一張卡片。在測試前,主持人會介紹說“當我說開始的時候,你就可以開始讀任務完成任務了”之類的話。所以從拿到任務卡片就可以開始計時。 

2、用戶的行爲是不可預期的。如在實際測試的過程中,就算用戶完成了一個任務,他會繼續點擊查看其他的內容,原因可能是他不確定是否完成了任務。 

3、一些資料會推薦一個用戶的時間大概是25-40分鐘,時間長了可能不耐煩。但是,如果用戶是通過層層篩選選來的,是有償的,那麼測試時間可能達到90分鐘/人,因爲要儘量不浪費資源。 

4、測試過程中,有的用戶會表現出煩躁、敷衍等行爲,主持人要及時的停止測試,因爲測試數據可能不準確。

 5、對於“精品用戶”,如第3點中提到的,每個用戶需要測試90分鐘,那麼一般一下午只能安排3名左右的測試者。

 6、做了就比不做好。專業的可用性測試需要專門的設備、資源,但是也可以根據自己的實際預算、產品的階段進行簡單的可用性測試。


以下是分享會的內容,分可用性測試的介紹和步驟兩部分,其中步驟又分爲測試前的準備、正式測試、測試後數據的分析3個小部分。

一、介紹

1、定義

在特定場景中,通過觀察用戶完成特定任務時,所產生的一系列指標。常見的3個指標是:有效性、效率、用戶滿意度。

·有效性:用戶完成任務的完成度,對應用戶目標;

·效率:用戶完成任務需要耗費的時長;

·用戶滿意度:用戶對該系統的舒適度和認可度,偏主觀。

2、可用性測試方法有哪些?

網上搜索“可用性測試”或“usability method”,會發現有很多的研究方法,比如原型測試、問卷調查等幾十種。這是因爲可用性測試並不是單一的方法,它是由多種方法組成的。

根據自己產品的性質、所處的不同階段、經費等,採用不同的方法組合來做可用性測試。比如在產品初期,可能只有概念稿、紙質版原型,也是可以做可用性測試的;公司經費允許,想做的更專業,可以找第三方公司做可用性測試,比如眼動測試就需要專業的設備。

此外,可用性測試並不是專門給用研人員用的。產品經理可以驗證原型、交互設計師可以發現可用性問題、視覺設計師有類似圖標的可用性測試和內容的可用性測試等,所以掌握可用性測試,是一個非常基本的技能。

下圖列出的是可用性測試中常見到的一些方法:

在這種圖中,大部分的方法我們工作中都有接觸。從最底部往上看:紅色的是面向專家的方法,比如公司內部設計方案評審;綠色方法比如面對面測試,如我們平時找同事尋求意見等;卡片分類法常用在互聯網行業中,規劃和設計信息架構。……所以可用性測試的很多子方法,我們都或多或少接觸過。

3、可用性測試分類

這麼多的方法如何排列組合,怎麼用呢?

一般情況,把可用性測試分爲2大類:形成型可用性測試和總結型可用性測試。簡單看來這兩大類的區別是:前者適用於項目前期,後者適用於項目上線後期;前者簡單快速,後者專業要求高;前者目的是快速發現問題,後者更傾向於看指標數據。

下圖是這2大類的具體區別以及常用的方法:

4、爲什麼做可用性測試

所以可用性測試的本質就很好理解了,功能與流程含有不確定性,找到目標用戶還原使用場景進行測試驗證,以評測設計是否行得通、哪裏需要改進,爲功能上線減少風險加強容錯,減少試錯的成本。

5、可用性測試流程概況

如同餐廳推出一個新系列的菜品試喫一樣,可用性測試可與試菜環節相類似。爲了便於理解,我們以餐廳試菜做比喻。

二、步驟

以試菜爲類比,接下來就講一下可用性測試的流程是怎樣的。

tips1

就像上新菜一樣,試菜往往是針對一系列新品的研究,並不是面向整個菜品的,可用性測試很少用於研究用戶對產品或服務的整體體驗。

tips2

試菜流程根據餐廳實際情況,可以招募一波試喫路人,也可以小範圍內不試喫。所以所,我們給出的可用性測試步驟,是通用的而非標準,根據實際情況取捨。

將可用性測試的整個過程分爲:測前準備,測試,測後分析3大塊。每一塊的關鍵內容如下圖:

測前準備

首先要確定目標,有了目標才能安排計劃。試菜的目標可能是:推出新系列產品,並且藉機宣傳。那麼它的計劃中就要包含邀請媒體報道了。

1、確定測試目標

2、準備測試計劃

計劃中包括:目標、測試內容、方法、時間計劃、用戶招募方案

在規劃測試過程之前,我們需要明確測試的方式,比如是遠程測試還是與用戶面對面的測試。注意爲了不影響最終測試結果,需要保證樣本用戶的測試方式統一。

3、界定目標測試用戶

用戶招募方案,根據產品的不同,可能需要不同類型的方法。比如管理員類用戶和普通員工,就是典型的兩種類型的用戶。這2類用戶可能存在重疊,但是測試功能模塊時候,要分開模塊進行測試。

4、撰寫大綱和腳本

5、招募&篩選用戶

可以通過官方發佈召集令,報名表信息含有:基本信息、產品使用情況、相關競品使用情況、是否有測試經驗、方便時間。再根據報名內容,進行層層篩選。

根據第3點中,測試用戶分類,每類大概招募6-8名用戶。

一般可用性測試單個模塊有5個測試者,就可以發現80%左右的問題,但是要多出1-2人備選。

專業類用戶4-5人,自由招募5-6人

6、準備測試物資

分兩類,一類物料(會議室、記錄設備),一類文檔類。

常用文檔資料如下圖:

可用性測試中的定量的問卷

我們在做產品或系統的可用性測試後,都想把結果更好地傳遞給相關方。除了定性的研究結果之外,還有定量的可用性問卷,這些可用性問卷是標準化的,不僅可以科學地量化用戶體驗,也方便相關方之間有效溝通。

常見的標準化可用性問卷有:整體評估問卷、任務評估問卷和網站感知可用性評估問卷,如下所示:

整體評估問卷

用於完成一系列任務場景後,對產品或系統整體的感知可用性測量。目前使用較廣泛的有:QUIS(Questionnaire For User Interaction Satisfaction)、SUMI(Software Usability Measurement Inventory)、PSSUQ(Post-Study System Usability Questionnaire)、CSUQ(Computer System questionnaire)、SUS(System Usability Scale)。

任務評估問卷

每完成一個場景任務,讓用戶對該任務進行感知可用性測量。目前使用較廣泛的有:ASQ(After-Scenario Questionnaire)、SEQ(Single Ease Question)、SMEQ(Subjective Mental Effort Questionnaire)、ER(Expectation Ratings)、UME(Usability Magnitude Estimation)。

網站感知可用性評估問卷

大部分標準化可用性問卷最初在20世紀80年代中期到後期被開發,在網絡開始流行時,出現了更有針對性的評估網站感知可用性的問卷,目前廣泛使用的有:WAMMI(Website Analysis and Measurement Inventory)、SUPRQ(Standardized Universal Percentile Rank Questionnaire)。

測中(正式測試)

終於開始測試了,正式的測試也分了幾個步驟。

1、測試介紹:

向用戶簡單介紹測試目的和流程,儘量讓他們處於一個比較放鬆的狀態,取得錄製視頻和使用數據的許可,簽訂保密協議;

2、測試前問卷:

測試產品前,填寫一個簡單的問卷,除了簡單的個人信息外需要了解用戶對相關產品使用經驗和習慣等;

3、測試場景與任務:

開始進行測試,在用戶完成任務過程中觀察用戶的表情和肢體動作,在完成任務後提出一些簡單的口頭問題;

4、任務後問卷:

在完成一個任務後,用ASQ(After Scenario Questionnaire)梯度問卷調查滿意度,再進行下一個任務的測試;

5、測試後問卷:

在所有任務完成後,用戶需要填寫一個關於整體滿意度的梯度問卷,通常使用的是SUS(System Usability Scale)——系統可用性量表。

注意事項:

保持測試環境免受干擾

向被測試人員說明:測試內容、目的、流程、時長、剛剛填寫的個人資料表的處理方式。讓被測試者有好的認識同時打消顧慮

測試過程中的記錄,錄音、錄像、筆記

記錄人員不要直接告訴被測試者怎麼操作

測後分析

通過可用性測試,我們得到了單個用戶的記錄內容。測試時的記錄點:求助節點、問題描述、微表情反應。所有跟數字相關的數據如時間:後期根據錄音、錄屏進行整理。

下面來看如何得到文章一開始說的3個指標,有效性、滿意度、效率

1、有效性

有效性對應用戶是否能成功完成任務。

功能有效性計算公式:有效性=(完全完成任務用戶數x1+部分完成任務用戶數x0.5)/用戶總數

2、滿意度

滿意度是一個主觀的感受,爲了量化,我們通過問卷調查的方式來獲取。滿意度又分爲單個任務的滿意度和整體的滿意度。分別用ASQ問卷和SUS問卷獲取。

3、效率

效率對應時間,用用戶完成單個任務的耗時長短來衡量。四捨五入精確到秒,數值越大效率越低。

效率=平均用時/熟練用時

熟練用時:對功能熟悉的人(PM、測試、設計師)按照任務提示進行操作,記錄完成操作所需的時間,多個人操作取平均值,四捨五入按秒計時。

限定時間:根據熟練用時而定,熟練用時的3~10倍,保證一個任務不超10分鐘。計時單位:四捨五入精確到分。

完成時間

開始時間:用戶拿到任務卡開始計時。不要等用戶讀完任務卡計時,因爲有人喜歡讀一條記一條,有人喜歡讀完所有任務再操作。

結束時間:不要在觀察到任務完成了就結束,而要用戶宣佈自己已完成再結束,因爲有人在操作完喜歡檢查自己是否操作成功。計時單位:四捨五入精確到分。

4、可用性水平

通過以上3個指標,我們可以得到功能的整體的一個可用性水平。對有效性,效率,滿意度做量化處理,按照5:3:2的權重計算得分:可用性水平=有效性x0.5-效率x0.3+滿意度x0.2

注意,這裏的權重不是固定5:3:2,根據實際項目的需求,來決定佔比水平。

5、結果的利用

注意點:

·可用性測試得出的結論可能是體驗的優化、方案的決策、設計的輸入,不會動產品大的方向,是微調而不是改版

·要做減法而不是加法。發現了問題要取優先級,發現了更多的需求也要取優先級,上線壓力要減去一些功能

·做了優化要去驗證,優化是否有效

通過可用性測試,我們會得到很多的反饋、問題,用Excel表整理問題清單,用高中低標註,在修改問題時有先後順序


參考文檔

1. Why You Only Need to Test with 5 Users

https://www.nngroup.com/articles/why-you-only-need-to-test-with-5-users/

2. Usability Test, Even When You Know the Answer

https://www.nngroup.com/articles/test-when-you-know-answer/

3. Usability Testing 101

https://www.nngroup.com/articles/usability-testing-101/

4. SUS超全解析

http://www.lanlanwork.com/blog/m/?post=8275

5. 寫任務需避免的10大錯誤

https://mp.weixin.qq.com/s/BrBWxBc9zl3WvhNQPfqI5Q

最後,關於可用性測試的一些知識思維導圖、模板等內容,感興趣可以私信。有問題歡迎交流。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章