世界真小：西方可用性規則預言中國在線書店用戶的行爲

這項研究調查了西方可用性規則是否可以應用於中文網站。Nielsen 等在2000年根據研究領域內的觀察提議了一套207條可用性規則。我們採用了其中48條作爲子集，研究四家中文在線書店的依從率（譯者注：另譯爲順應度）（一個網站所符合的規則條數，除以總的規則條數），任務完成時間，任務準確程度，以及用戶的可用性感受和喜好程度。結果顯示遵從可用性規則和站點可用性有顯著關係：隨着站點依從率的升高，用戶所感受到的站點的可用性和印象也在提高。這一結果揭示了決定中文用戶行爲的規則和西方用戶極爲相似。簡言之，這一研究質疑了很多人認爲亞洲站點和西方站點的可用性（標準）應該不一樣這一普遍的直覺。

關鍵詞：網絡可用性，文化，電子商務，人機交互

1、簡介

可用性從根本上決定一個界面，飛行員座艙，一個新的射擊遊戲，或者一個網站的成功與失敗是毋庸置疑的。就像2000年新經濟的徹底垮臺所告訴我們的，無論投入多少資金和注意力在系統的特色，市場以及品牌等方面，如果用戶不會使用就不會購買它。不過，技術行業危機的一個好處就是提高了在軟件，網站和用品設計中對於可用性的角色的的理解。

1.1 什麼是可用性

認識到可用性的重要性是一回事，而真正創造一個更具可用性的界面是另外一回事。對於想要創建更具可用性網站的設計者來說，他們面臨着很多的問題。首先，可用性的定義是必需的，特別是可用性是應該作爲屬性還是過程。前一觀點由Jakob Nielsen提出，在許多討論（比如Nielsen等, 2000; www.useit.com）中，他認爲可用性是由遵循一系列協議（測試項目的正確數目，使用正確的可用性規範）所獲得的系統狀態。按照Nielsen的觀點網站的可用性是由同質化建立的，如果不是所有的網站，至少很多是這樣（書本銷售網站，旅遊網站，等等）。Nielsen被廣爲引用的觀點是，因爲用戶用更多的時間瀏覽其他網站，你應該按照其他站點的模式設計你的站點(Nielsen, 2000)。按照這一邏輯，Nielsen和同事綜合了大量的可用度較高的網站的元素，爲電子商務網站提出了一系列可用性準則。按照作者的說法，更好地遵守這些準則將會創建更爲可用的網站。最後Nielsen認爲可用性缺陷可以很容易的被發現，並建議執行僅僅五項用戶測試（他認爲將會發現85%的問題；Nielsen & Landauer, 1993）。

Jared Spool和用戶界面工程（User Interface Engineering，編者注：此爲Jared Spool的公司名稱）的合作者們和從事用戶界面工程的合作者對於可用性有很不同的觀點。按照他們的看法，可用性是一個站點的過程而不是屬性。因此，如果一個網站（或者其它界面）經歷了提高可用性的過程，這個站點將會變得更加可用；如果不經過，則這個站點很可能會卻乏可用性。Spoo對於可用性概念的關鍵看法是可用性是不可建立規則的。考慮Spool的兩個發現。第一，他與Nielsen相反，認爲五個用戶遠遠不能夠發現網站的可用性問題；大概必須的的數字應該是18-90或者更多（Spool & Schroeder, 2001）。和Nielsen觀點之所以不同原因之一是因爲Spool對於可用性任務的概念 – 正如Hudson（2001）所指出的，Spool提倡一種開放式的，相對來說不受約束的可用性測試，這種測試需要更多的測試用戶以找出站點潛在的可用性問題。

1.2 可用性指導規則的有效性

Spool和Nielsen觀點的第二個不同之處是關於可用性指導規則的有效性。爲了和“可用性即過程”觀點一致，Spool認爲除了可用性測試協議以外，沒有什麼能完善可用性指導規則。他認爲指導規則容易執行但是顯得相當無效。在最近的一篇論文中（Spool, 2002），他認爲指導規則難於解釋，或者直接就是錯誤的。例如，他測試了Bernard（2002）的指導規則，電子商務網站的共同功能，比如加入購物車按鈕應該被放置在網頁上用戶所期待的位置。按照Spool的看法，當那些功能的位置（已經）被熟練使用的時候，用戶體驗實質上並不是站點可用性的有效預測。因此，指導規則的邏輯不能進行預測用戶行爲。理所當然地，如果可用性指導規則沒有被測試，很難認爲遵從這些原則會得到一個可用的界面。

1.3 可用性的文化差異

除了Spool關於可用性指導原則的有效性考慮，我們必須考慮它們的一般性（通用性）。大多數這樣的指導規則（例如Bernard， 2002；Nielsen, et al., 2000）是通過觀察美國用戶和少數歐洲用戶制定出來的。然而網絡是世界範圍的，每個國家的網站設計者都開始考慮可用性（另外，美國的設計者考慮網站對於國際用戶的可用性）。爲一種文化或者語言羣體開發的指導規則在多大程度上能預測另外文化和語言羣體的可用性？這有許多種可能性。首先，把計算機界面翻譯成另外的語言並非總是切實可行和合適的（Kukulska, 2000）。當把英文界面翻譯成亞洲語言比如中文時，這一觀點顯得尤爲真實。書面中文使用基於語義的縮略寫法，語言元素的結構內涵關係比在英文中更緊密。另一方面，英語是基於聲音的邏輯，因此我們可以把它的視覺形態作爲發音提示，但是不能僅從他的結構得到一個單詞的意義。中英文語言系統的差異在認知機能上會產生許多差異（即著名的關於語言相關性的沃夫假說，Whorf, 1956; 請查看Roberson et al., 2000, 獲得更新的信息）。

第二個將一種文化的標準推廣到另一種文化時產生的問題來自社會文化標準和認知方式。心理機能的許多方面，從審美到人際動力動機，會由於文化而不同。因此由一種文化衍生的行爲規則不能轉化爲另一種文化（的規則）。例如，Choong 和Salvendy (1999)調查了文化差異對於中國和美國用戶分別適合的界面設計的影響。他們發現中國參試者比美國參試者在具體知識表述和主題界面結構方面有更好的表現。

另一方面，網站可用性指導規則主要着重於基本的人類信息處理，象記憶和注意廣度。從這種意義上來說，指導規則應該既適用於東方也適應於西方。因此，判斷美國和歐洲的網站可用性指導規則是不是適用於中國網站用戶是一個重要的問題。當然，正如Spool所指出的，網站設計者和諮詢顧問已經爲別人提出了在建設網站時所應該考慮的一系列可用性指導規則，但是並沒有進行什麼評估試驗來驗證指導規則是不是真正能夠創建了更好的網站。因此，在調查他們跨文化有效性的同時，有必要採取研究在任意背景環境下來系統地測試和驗證這些可用性指導規則。

1.4 常規的研究方法

最廣爲流行的，最新的可用性指導規則來自Nielsen等人(2000)。他們測試了二十個b2c電子商務網站。64個來自美國和丹麥的參與者被要求在這些網站進行購物活動。用戶被要求在操作時出聲思考，由接受過訓練的觀測者紀錄。基於研究過程中的觀測記錄，以及專家的經驗，Nielsen等(2000)獲得了創建更好的電子商務用戶體驗的207條可用性設計指導規則（後來被稱爲“尼爾森”法則）。這些指導規則涵蓋了大範圍的主題，包括銷售策略，信任感，分類頁面，搜索，產品頁面，檢驗與註冊，以及國際性用戶。通過制定指導規則Nielsen等提供了一個網站可用性的相對客觀的評估方法。然而，這項研究存在一些缺陷。首先，指導規則的應用極大地依賴於技巧，經驗，以及觀測者和專家的個人能力。不是所有的組織都擁有具足夠實施技術的可用性專家。第二，更重要的是，作者沒有提供對於他們的指導規則的效用的試驗測試。造成的後果是，琳呤導噬鮮潛桓嬤嘈胖傅脊嬖虻撓行浴Ｎ司勒庖晃侍猓枰捎靡桓齠鍆獾氖笛檠芯懇匝櫓す嬖虻撓行浴?/p>

在這個研究中，我們評估了Nielsen指導規則是不是預測了香港網站的可用性。儘管全部規則包含了207條原則，我們着重關注和信息發掘有關的指導規則。這個決定有一些原因，首先，定位目標信息是大多數網站的基本任務，特別是在線購物。因此，檢查網站怎樣被組織以推動信息搜索，以及是否能很容易地獲得適當的信息，被認爲是在線服務成功的重要因素。根據Nielsen等 (2000)的研究，不能找到信息條目是最常見的任務失敗原因。其次，許多指導規則的驗證需要對於被試網站的結構和編程的知識，這些在在這次研究中是無法滿足的。因此，我們選擇了48條有關於導航和產品以及服務信息的指導規則。被選擇的規則包括分類區域，搜索功能，篩選工具，產品列表頁面，以及產品和客戶服務信息。

我們假設，如果Nielsen指導規則適用於香港，一個網站遵從越多的規則就會越易於使用。我們選擇了四個中文的在線書店，以便減少網站之間的差異，然後以任務完成時間，任務準確率和一張問卷調查來評估網站的可用性。另外，我們評估了每個網站的用戶整體印象。

2. 方法

2.1 設計

這個試驗是一個單向的主題確定的設計。有四個不同指導規則遵從度的網站。因變量是任務完成時間，準確率，網站的可用性感受和喜好程度。

2.2 測試參與者

二十個來自香港中文大學的本科學生（十個男生和十個女生）參與了實驗。所有參與者母語是中文（粵語），他們都熟悉中文文字處理程序。

2.3 材料

2.3.1 網站可用性指導規則
Nielsen等(2000)的研究中的四十八條規則被採用。包括三類：關於產品信息（比如提供產品的察看和/或者分級）；用戶服務信息（比如提供首頁到運輸和遞送信息的鏈接）；以及導航方法 i）搜索功能（比如在每頁放置搜索輸入框）和ii）分類（比如多重分類模式）。一些包含多種含義或者標準的規則被棄置。只有具體和有相當客觀解釋的規則被選擇。另外，我們有兩個獨立評定人以評價每個網站對規則的遵守程度；這個程序產生了一個相對比較高的認同率（參考下一章節）。

2.3.2 網站
我們選擇了四個具有不同指導規則遵從度的中文在線書店。他們是 (A) isubculture.ichannel.com.hk ; (B) www.compubook.com.hk ; (C) www.hongkongbooks.com.hk ; and (D) www.cp1897.com.hk 。這些書店的指導規則遵從度分別是21%, 40%, 52% 和73%。四個網站的內部評估可靠度從0.73到0.92。

注意：這個研究發生在2001年後期，因此每個網站的遵從度有可能已經改變了。

2.3.3 任務
我們設計了三類任務；產品信息（比如在“電子商務介紹”，作者是不是提到了電子支付系統？）；用戶服務信息（比如，我能用自動取款機支付賬單嗎？）；以及根據預定義標準搜索一個特定產品（比如，請找到一本能告訴我在蛇年運程的書）。

2.3.4 調查問卷
調查問卷用於評估被試對網站的主觀印象。它是一個七分的雙向量表，由兩個子量表組成。第一子量表關注喜好程度，評估參與者的主觀感受，對網站的評價和信任度（比如，你覺得這個網站有吸引力嗎？你從這個網站購買貨品的可能性有多大？你覺得這個網站可靠嗎？）。第二個子量表評估參與者對網站的可用性的知覺。調查問題包括網站是否提供了充分的產品相關信息（比如，你覺得這個網站對於書目的提供了充足的信息嗎？）；導航和搜索功能（比如，你覺得這個網站導航功能是否容易使用？你覺得在這個網站搜索特定的書目是難不難？）。

2.4 程序
所有被試單獨進行測試，呈現給每個被試的網站和測試任務的次序是隨機的。在實驗前給被試一分鐘熟悉網站，然後進行第一個任務。任務完成時間由第一次移動鼠標直到他們第一次嘗試動筆寫答案的這段時間。在完成對某個網站的三個任務後，要求被試完成一份問卷以衡量喜愛程度和易用性。每個網站的實驗程序是相同的。在實驗過程中有一個觀察員記錄每個任務的完成時間並且協助進行實驗。觀察員不允許回答任何會影響到任務完成效果的問題。

3. 結果和討論

網站可用性通過任務完成時間、準確性和用戶對網站可用性的判斷來衡量，同時“喜好”程度（likeability）量表用來衡量用戶對網站的偏好。任務完成時間和準確性（客觀測量）是把每個網站的三個任務的績效進行平均後得到的。只有在任務正確完成的前提下才會包含完成時間的測試數據。知覺可用性和“喜好”程度（主觀測量）通過百分數表示，其指標是通過計算問卷量表中相關項目的平均得分然後除以總分得到的，百分數越高表明知覺可用性和“喜好”（likeability）程度越高。然後進一步採用重複測量的單向方差分析（ANOVA）比較四個網站在每個因變量上的差異。

圖一用戶行爲的測量左邊是每個網站的平均完成時間，右邊是完成這個任務的準確性。圖1和圖2中網站順序是按照對可用性指南的遵從程度的增加排列的。

3.1 客觀測量

前兩個因變量測量用戶與網站的交互行爲。圖1表明，隨着對可用性指南遵循程度的增加，任務的績效也在增加。並且在任務完成時間（F(3, 57)= 24.00, p<0.001）和完成準確性（F(3,57)=8.92, p<0.001）都存在顯著差異。因此，對Nielsen指南的遵從程度與網站的可用性存在明顯的聯繫。

3.2 主觀測量

後兩個因變量測量被試對網站不同方面的判斷（圖2）。與客觀測量一樣，判斷與網站對指南的遵從程度存在聯繫：遵從的指南越多，可用性和“喜好”的評定就越好。方差分析表明，知覺“喜好”程度（F(3,57)=30.22, p<0.001）和知覺可用性（F(3,57)=33.56, p<0.001）在統計上是存在顯著差異的。結果表明Nielsen的指南不僅能夠預測用戶的行爲，而且能夠預測用戶對他們與網站交互的判斷，以及他們是否喜歡這種交互。

3.3 線性趨勢

爲了進一步證明假設，採用了計劃比較的方法分析了四個網站在因變量上的趨勢。四個網站在任務完成時間(p<0.001)、任務準確性(p<0.001)、知覺的“喜好”程度 (p<0.001)和知覺的可用性(p<0.001)的線性比較均達到了統計上的顯著不同。因此，網站之間不僅在績效上存在顯著差異，而且這些差異呈線性趨勢。從圖1和圖2的可以看出，對於每個因變量這種趨勢表現爲：當對可用性指南的遵循程度增加時因變量的分數變好（完成時間縮短，其它測量指標升高）

圖 2. 用戶主觀評定的測量左圖表示用戶對知覺可用性的判斷，右圖表示用戶對網站的喜好程度的評定。

4. 結論

4.1 對中文網站設計者的啓示

本研究表明Nielsen的可用性指南對中文網站也是適用的。網站對指南的遵循程度直接與可用性和用戶對網站的好感成正比。本結果的重要性表現爲：它提供了證據支持可用性原則能夠預測非英語、非歐美文化網站的交互效果。此外，本研究的測量同時是以績效和主觀評定爲基礎，並且都受對可用性指南遵循程度的影響。從這些結果來看，很難認爲可用性是不重要的，中文網站的可用性與其它民族的可用性並不存在根本的不同。對可用性原則的遵循能夠幫助中文網站提高可用性並給予用戶更好的印象，因爲用戶執行任務的時間和準確性都得到了改善。

我們同時也應該指出，這並不表明中文網站的可用性原則和歐美網站是一模一樣的。很明顯，文化或者語言的某些特徵會影響可用性，這應該在可用性原則中與文化有關的部分適當的表現出來。此外，在其它環境中非常重要的可用性規則對中國或者亞洲可能並不是很重要。然而，雖然上述觀點可能是正確的，但並不意味着可以認爲“中國/亞洲的可用性與其它地方的可用性存在不同”。正相反，亞洲網站的設計人員具有證明網頁使用的哪些方面是與文化有關的的責任。我們認爲除非這種證據存在，否則網頁設計師應該採用與西方相同的可用性標準。

除了這些共同的地方，研究過程中發現與中文環境相關的一些網頁設計問題還是比較明顯的。首先，在雅虎搜索頁的12個香港網上書店中，幾乎所有的網站都不支持組合搜索和搜索操作符（如＋，中文的‘和’、‘或’）。組合搜索能幫助用戶限制搜索範圍，準確的定位所需要的信息。這種搜索工具在英語網站中是比較普遍的，但在中文網站中並沒有得到普遍的使用。

其次，在這12個首先被研究的網上書店中，幾乎所有網站都不提供中文輸入的機制。因爲漢字輸入比英語輸入複雜，用戶不會使用漢字輸入不是不正常的。即使用戶對漢字的操作比較熟練，他們電腦的軟件也可能不支持漢字操作。因此，如果網站沒有提供一種途徑使用戶輸入漢字到文本框中，搜索功能就是不可用的。

4.2 對網頁設計的普遍啓示

在文章開頭我們討論了Jakob Nielsen和Jared Spool在可用性觀點上的區別。認識到Spool對可用性指南的批評，尤其是對它的有效性的確認的缺乏，本研究可以作爲對這個問題的一個校正。儘管沒有測試每個單個原則的有效性（即哪些是重要的，哪些並不是本質上的問題），我們確實發現指南的使用和可用性之間存在的聯繫。因此可以認爲儘管設計者需要對可用性指南持謹慎的態度，但它至少能夠預測網站的可用性以及對其的主觀知覺。雖然沒有什麼可以作爲可用性測試的代替品（“可用性作爲過程”），對正確的可用性指南的遵循能夠提高不論是東方的網站還是西方的網站的可用性。

儘管本研究證明了Nielsen可用性指南的有效性。我們還是贊成Spool的觀點：不進行具體的評估就不能保證可用性。儘管我們這裏測試的指南可以作爲一般的可用性測量方法，網站的許多重要問題可能並沒有被這些測試所反映出來。確實，在我們的研究基礎上，讓我們對具體每個網站應該如何改善可用性提出建議是比較困難的（雖然我們會在下一節發表一些評論）。要獲得更具體的信息，定性測試對任何發展週期都是至關重要。因此，我們推薦適度使用已證的指南作爲提高可用性的多種工具中的一種，而不是把指南作爲論證最終產品的唯一的工具。

本研究結果的另一個重要方面是可用性和傾向判斷之間的緊密聯繫。除了能夠縮短用戶搜索信息所需的時間外，對指南的遵循能夠增加用戶對網站和網站運營商的積極印象。在信息時代，主頁或者公司的網站或許是公司和顧客之間最初的聯繫點。因此，網站的可用性是非常重要的，因爲用戶對網站的最初印象會對用戶對公司的感覺起長久的作用。

4.3 網站的具體問題

總的來說，我們測試的網站的設計離完美還差得很遠。這一部分是因爲網站設計，特別是香港的網站設計，纔剛剛開始發展。在這些結果的基礎上，我們建議設計者在建構網站時遵循實驗證實有效的可用性指南。本次研究所證明的三類有效的指南是：首先，提供充分的信息和對產品的詳細描述；其次，提供顧客服務的信息，如交付時間和郵資；第三，爲分類、導航系統和搜索提供清晰的、系統化的結構。

在被試進行實驗時，絕大多數在以下幾個地方出現了問題：

i) 搜索–當被試準確的輸入書名，但卻沒有返回相應的結果時他們非常驚訝。大多數被試於是認爲在書店中並不存在這種商品，而不是試圖通過其它途徑來尋找這種商品。表明網站需要非常仔細的檢查搜索數據庫，避免這種失誤引起銷售上的大額損失。
ii) 會員註冊 – 許多被試在要求註冊爲會員時就停止了搜索。會員註冊是用戶使用的阻礙，這與許多報告的結果一致。因此，網站應該最小化註冊過程。
iii) 信息不明確 – 完成時間延長的一個主要原因是被試常常不能找到所需要的信息。這可能是因爲一些有用信息的字體比較小、或者所在的位置比較難以辨認、或者夾雜在一些不重要的信息中。因此，我們建議網站應該強調關鍵或者重要信息並且將他們放在容易識別的位置，使用戶不至於漏掉它們。

4.4 總結

無論是把可用性看作屬性還是過程，從本研究可以得到兩個結論。首先，指南對網站之間的可用性差異是敏感的。通過使用指南可以整體提高可用性。第二，亞洲（特別是香港）似乎與美國或者歐洲的遵循非常相似的可用性規則。如前所述，我們期望發現東西方可用性的一些差異，但實際上這些差異很難被證明，並且也許真正的情況並不像想象的那麼明顯。因此，如果除非有明確的原因採用其它方式，亞洲網站的設計者應該把西方的可用性規則用到網站設計中。

5. 參考文獻

Bernard, M. (2002). Examining user expectations for the location of common e-commerce web objects. Usability News, 4.1. Downloadable from http://psychology.wichita.edu/surl/usabilitynews/41/web_object-ecom.htm

Choong, Y.Y., & Salvendy, G. (1999). Implications for design of computer interfaces for Chinese users in Mainland China. International Journal of Human Computer Interaction, 11, 29 – 46.

Hudson, W. (2001). How many users does it take to change a web site. SIGCHI Bulletin, May/June 2001, 6.

Kukulska, H.A. (2000). Communication with users: Insights from second language acquisition. Interacting with Computers, 12, 587-599.

Nielsen, J. (2000). End of web design: Alertbox for July 23, 2000. Available at www.useit.com/Alertbox/20000723.html

Nielsen, J., and Landauer, T. K. (1993). A mathematical model of the finding of usability problems. Proc. ACM INTERCHI’93 Conf. (Amsterdam, the Netherlands, 24-29 April), 206-213.

Nielsen, J., Molich, R., Snyder, C., & Farrell, S. (2000). E-commerce user experience. Nielsen Norman Group: Fremont.

Roberson, D., Davies, I, & Davidoff, J. (2000). Color categories are not universal: Replications and new evidence from a stone-age culture. Journal of Experimental Psychology: General, 129, 369-398.

Spool, J. (2002). E??volution trumps usability guidelines??. UIE-tips newsletter, September 9, 2002. Downloadable from http://www.uie.com/Articles/evolution_trumps_usability.htm

Spool, J., & Schroeder, W. (2001). Testing web sites: Five users is nowhere near enough. Proc. CHI 2001, Extended Abstracts, ACM 285-286.