史上最全的搜索下拉提示用戶交互研究——讀《An Eye-tracking Study of User Interactions with Query Auto Completion》

搜索下拉提示（Query Auto Completion，簡稱QAC）現在幾乎是每個搜索引擎必備的基本功能，作用是在用戶在搜索框輸入查詢詞的過程中，給用戶展示一系列搜索查詢query供用戶選擇，可以方便用戶輸入、縮短用戶搜索時間、提高用戶搜索體驗。在這方面的研究已經有很多，如基於上下文、基於時間序列等預測query的熱度、個性化排序等，但關於用戶如何與搜索下拉提示（下文簡稱QAC）交互的研究目前還是一個空白。

微軟的Katja Hofmann前幾天(11.3-11.7)剛剛填補了這一空白，她在CIKM 2014會議上發表了一篇paper——An Eye-tracking Study of User Interactions with Query Auto Completion，研究了用戶與QAC的交互過程。通過眼睛定位技術，記錄和分析了用戶與QAC的交互，得出一系列有趣的結論。本文在閱讀論文的基礎上，簡明扼要的提煉了論文的結論，總結了一點自己的啓發。

有用的思路和結論：

1. 將用戶的QAC交互過程分爲：query examination、query formulation、task completion3個過程。query examination爲用戶查看QAC的過程，該過程中用戶注意到有QAC的提示，並將注意力集中到QAC的結果。query formulation是用戶使用QAC的過程，根據QAC提供的結果選擇的過程。task completion是用戶選擇了QAC的結果後在搜索結果頁面的行爲，記錄用戶的搜索任務完成情況。

2. 針對每個過程設計了一系列跟QAC相關的統計指標，以反映QAC的質量，具體指標如下：

TFF記錄用戶敲鍵盤到將注意力轉移到QAC下拉列表的時間間隔，這個時間跟QAC下拉結果的排序沒有關係。

CFT記錄用戶注意力集中在QAC下拉列表上所累計停留的時間，這個時間跟QAC下拉結果的排序有關，排序結果質量越好，越跟用戶搜索意圖相關的query越靠前，用戶停留的時間越短。

UQ表示用戶提交的單一query數，描述的是一個用query構造的情況，如果QAC質量不好，用戶很難構造一個比較恰當的query，則在沒法構造query的情況下就會放棄繼續搜索。（筆者見解：也有可能是質量好，一次query搜索就找到需要的結果）

UR表示用戶打開一個搜索結果頁面就完成搜索的數量，描述搜索結果質量，打開越少，說明搜索結果質量越高，越早完成搜索任務。TFC和TCT與其類似，只是從其他角度統計。

3. QAC有很強的position bias，排名越靠前的query被關注和點擊的概率越大，如下兩圖：

右圖橫軸表示query在QAC的排序位置，左邊縱軸表示用戶的注意力停留時間，右邊縱軸表示點擊的概率，每個位置分別都有兩個不同的實驗，對比QAC有排序和隨機序的情況。

從圖可以看出，不管QAC結果是否有排序，top幾個位置的query獲得的注意力是最高的，被點擊的概率也明顯高於其他位置的query，這說明top幾的query被關注到的概率最大，與query的是否排過序無關，只要在top的位置，肯定會被關注到，有很強的position bias，也側面說明QAC的排序最終決定了哪個query被作爲查詢query。

但也可以觀察到，排序過的結果被點擊的概率比隨機排序的大一些，因爲排序會把更符合用戶搜索意圖的query排到前面。

4. 儘管無論QAC的結果排序與否，排序位置靠前的query獲得的注意力都一樣大，但搜索結果質量是不同的，通過實驗記錄的UQ、UR、TFC、TCT數據表明，高質量query的搜索結果比較好，可以讓用戶更快找到需要的內容，結束搜索任務。因此需要把更符合用戶意圖的query排到更靠前的位置，增加這類query的曝光有助於帶來更好的搜索結果質量（電商類的有助於提高成交轉化率）

5. 總結了用戶使用QAC的3種pattern：a. 依賴QAC搜索的用戶，邊輸邊看QAC的結果；b. 偶爾使用QAC的用戶；c. 從不使用QAC的用戶，這類用戶一般在輸入的過程中注意力是集中在鍵盤，不看屏幕，屬於電腦使用不熟練的用戶，比例較小。

6. 總結了用戶使用QAC的2個目的：a. 拼寫提示或拼寫糾錯；b. query補全

7. 實驗證明MRR這種評價QAC質量的指標的合理性，該指標基於這樣的假設，排序越靠後的結果被用戶注意到的可能性越小，結果就是排序越靠後的結果被點擊的可能性越小，從3的實驗結果可以得到驗證。

啓發：

1. QAC的排序很重要，直接影響搜索結果的質量，對於電商類搜索，會影響最終的轉化率，因此可以在排序中引入搜索結果頁質量相關的特徵，如ctr、成交情況、NDCG等。

2. 用戶使用QAC的一個功能是拼寫提示，因此可以加入拼寫糾錯的提示功能，不僅僅是簡單的prefix匹配。

參考：

An Eye-tracking Study of User Interactions with Query Auto Completion

轉載請註明出處，本文轉自：http://blog.csdn.net/huagong_adu/article/details/40951409

本博客搬遷至：http://ralphadu.com/

史上最全的搜索下拉提示用戶交互研究——讀《An Eye-tracking Study of User Interactions with Query Auto Completion》

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

C++程序的編譯過程及g++與之對應的幾個參數

讓我思潮翻滾的IBM面試內容

如何不生成XML文件通過Socket傳XML文件內容

C++複製構造函數的詭異行爲研究

從月薪3500到700萬——一個大學生的成長經歷

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結