史上最全的搜索下拉提示用戶交互研究——讀《An Eye-tracking Study of User Interactions with Query Auto Completion》

        搜索下拉提示(Query Auto Completion,簡稱QAC)現在幾乎是每個搜索引擎必備的基本功能,作用是在用戶在搜索框輸入查詢詞的過程中,給用戶展示一系列搜索查詢query供用戶選擇,可以方便用戶輸入、縮短用戶搜索時間、提高用戶搜索體驗。在這方面的研究已經有很多,如基於上下文、基於時間序列等預測query的熱度、個性化排序等,但關於用戶如何與搜索下拉提示(下文簡稱QAC)交互的研究目前還是一個空白。

        微軟的Katja Hofmann前幾天(11.3-11.7)剛剛填補了這一空白,她在CIKM 2014會議上發表了一篇paper——An Eye-tracking Study of User Interactions with Query Auto Completion,研究了用戶與QAC的交互過程。通過眼睛定位技術,記錄和分析了用戶與QAC的交互,得出一系列有趣的結論。本文在閱讀論文的基礎上,簡明扼要的提煉了論文的結論,總結了一點自己的啓發。


有用的思路和結論
        1. 將用戶的QAC交互過程分爲:query examination、query formulation、task completion3個過程。query examination爲用戶查看QAC的過程,該過程中用戶注意到有QAC的提示,並將注意力集中到QAC的結果。query formulation是用戶使用QAC的過程,根據QAC提供的結果選擇的過程。task completion是用戶選擇了QAC的結果後在搜索結果頁面的行爲,記錄用戶的搜索任務完成情況。

        2. 針對每個過程設計了一系列跟QAC相關的統計指標,以反映QAC的質量,具體指標如下:
        TFF記錄用戶敲鍵盤到將注意力轉移到QAC下拉列表的時間間隔,這個時間跟QAC下拉結果的排序沒有關係。
        CFT記錄用戶注意力集中在QAC下拉列表上所累計停留的時間,這個時間跟QAC下拉結果的排序有關,排序結果質量越好,越跟用戶搜索意圖相關的query越靠前,用戶停留的時間越短。
        UQ表示用戶提交的單一query數,描述的是一個用query構造的情況,如果QAC質量不好,用戶很難構造一個比較恰當的query,則在沒法構造query的情況下就會放棄繼續搜索。(筆者見解:也有可能是質量好,一次query搜索就找到需要的結果)
        UR表示用戶打開一個搜索結果頁面就完成搜索的數量,描述搜索結果質量,打開越少,說明搜索結果質量越高,越早完成搜索任務。TFCTCT與其類似,只是從其他角度統計。

        3. QAC有很強的position bias,排名越靠前的query被關注和點擊的概率越大,如下兩圖:
  
        右圖橫軸表示query在QAC的排序位置,左邊縱軸表示用戶的注意力停留時間,右邊縱軸表示點擊的概率,每個位置分別都有兩個不同的實驗,對比QAC有排序和隨機序的情況。
        從圖可以看出,不管QAC結果是否有排序,top幾個位置的query獲得的注意力是最高的,被點擊的概率也明顯高於其他位置的query,這說明top幾的query被關注到的概率最大,與query的是否排過序無關,只要在top的位置,肯定會被關注到,有很強的position bias,也側面說明QAC的排序最終決定了哪個query被作爲查詢query。
        但也可以觀察到,排序過的結果被點擊的概率比隨機排序的大一些,因爲排序會把更符合用戶搜索意圖的query排到前面。

        4. 儘管無論QAC的結果排序與否,排序位置靠前的query獲得的注意力都一樣大,但搜索結果質量是不同的,通過實驗記錄的UQ、UR、TFC、TCT數據表明,高質量query的搜索結果比較好,可以讓用戶更快找到需要的內容,結束搜索任務。因此需要把更符合用戶意圖的query排到更靠前的位置,增加這類query的曝光有助於帶來更好的搜索結果質量(電商類的有助於提高成交轉化率)

        5. 總結了用戶使用QAC的3種pattern:a. 依賴QAC搜索的用戶,邊輸邊看QAC的結果;b. 偶爾使用QAC的用戶;c. 從不使用QAC的用戶,這類用戶一般在輸入的過程中注意力是集中在鍵盤,不看屏幕,屬於電腦使用不熟練的用戶,比例較小。

        6. 總結了用戶使用QAC的2個目的:a. 拼寫提示或拼寫糾錯;b. query補全

        7. 實驗證明MRR這種評價QAC質量的指標的合理性,該指標基於這樣的假設,排序越靠後的結果被用戶注意到的可能性越小,結果就是排序越靠後的結果被點擊的可能性越小,從3的實驗結果可以得到驗證。

啓發
        1. QAC的排序很重要,直接影響搜索結果的質量,對於電商類搜索,會影響最終的轉化率,因此可以在排序中引入搜索結果頁質量相關的特徵,如ctr、成交情況、NDCG等。
        2. 用戶使用QAC的一個功能是拼寫提示,因此可以加入拼寫糾錯的提示功能,不僅僅是簡單的prefix匹配。

參考

轉載請註明出處,本文轉自http://blog.csdn.net/huagong_adu/article/details/40951409
本博客搬遷至:http://ralphadu.com/
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章