Intentinal Query Suggestion: Making User Goals More Explicit During Search

其實總結起來,自己多多少少也看了這麼多的文章了,但是很多文章都是在說如何分類的事情。一個關鍵的問題是:如果分類出來了,有什麼作用?今天找了一篇非常給力的論文,將查詢意圖分類應用到了查詢建議中。前面也講過一篇論文,應用的領域也是查詢建議的,而且也是“面向目的”的查詢建議。今天這篇論文的題目是《Intentinal Query Suggestion: Making User Goals More Explicit During Search》,翻譯過來是《基於意圖的查詢建議:使用戶的意圖更加顯式化,作者是Strohmaier等。

 

摘要

使用戶的查詢意圖更加的顯式化,顯然能夠提高搜索引擎的質量。相比於傳統的查詢擴展機制,本論文將介紹一種叫做“意圖查詢建議”的新方法,來使用戶的意圖更加的顯式化。將會介紹到他的方法論以及後面的評價:搜索結果的多樣化和獲得更好地點擊率的指標。

 

簡介

在IR中,查詢建議的本意使減少用戶查詢和文檔之間空白距離,也就是使用戶查詢和返回的文檔的相似性最大化。大規的日誌分析顯示,很多的查詢都表現出對於用戶真正想要的文檔的理解的缺乏。用戶在很多時候對於自己的根本目的歸納並不清楚,因爲他也根本不知道搜索引擎會給他返回什麼。這就是最大的問題所在,所以查詢擴展顯得非常的重要。

該論文將要闡明的問題是:相比如搜索引擎傳統的去猜測用戶的查詢中的詞語的意思,倒不如去讓用戶自己顯式的去說明自己的目的。我們引入了一個“意圖建議”的新概念。傳統的“建議”的目的是使查詢更加的貼近於返回文檔,但是本論文的興趣在於“使用戶的查詢更加的顯式化”。

可以舉例說明:傳統的對於“car”的擴展通常是“car rental”,"car insurance", "enterprise car retal", "car games"等。但是如果是基於意圖擴展的,我們希望得到的"rent a car", "sell your car", "repair your car"等。也就是擴展更加的注重的是用戶輸入這個查詢串的目的是什麼。

本論文的研究的重點是:現在的搜索引擎怎樣處理包含了明顯用戶意圖的查詢?以及基於意圖的查詢擴展能夠怎樣的影響搜索結果和點擊率。本論文分爲:定義“意圖查詢建議”,設計一個算法和做實驗驗證。

 

查詢建議

大部分的查詢建議都需要採用返回結果以及其他的比如日誌的資源來進行擴展。“意圖查詢建議”的最終目的就是“使用戶的查詢目的“顯式化”。我們定義”意圖查詢擴展“爲一個增量的過程:將一個查詢轉換爲一個新的基於意圖結構的查詢。在本論文中,需要人工抽取一些意圖,資源使日誌。

 

實驗設計

本論文中,最初的查詢將被一個意圖更加明顯的新的查詢替代。

數據集

來自MSN搜索引擎,採用了另外一個論文中的方法來抽取一些顯式意圖的查詢,當作是”顯式意圖查詢集“。採用了兩種方法結合來估計用戶的查詢意圖:基於文本和基於鄰居關係。其實這個說起來很玄乎,其實就是一個匹配的過程。因爲有了一些抽取出來的意圖集合,那麼接下來的就是需要對於新來的查詢進行匹配。

基於文本

兩個查詢可以簡單的看成兩個句子,那麼句子相似度的計算算法都可以使用,論文中採用的是Jaccard相似度,其實就是交除以並。

基於鄰近點

在基於文本的基礎之上,這裏還需要用刀一種基於查詢日誌鄰近信息的相似度計算。從日誌中建立一個二分圖,一種節點是包含了顯式意圖,另一種節點是包含的隱式意圖,在後面的相似度計算中就要利用這兩種節點。採用領結的查詢來進一步的表述和充實顯式的查詢。具體的過程也很簡單,對於一個顯式的查詢qe,那麼找到其前d個和後d個查詢來作爲他的鄰居,每個查詢都是一個tag的串。然後還需要定一個一個參數i來表示鄰居和qe的詞的交集,我們取至少交集大於i的鄰居來進行擴充。論文中有一個比較形象的例子,每一個顯示的查詢都會用鄰居來進行擴展。那麼在輸入一個查詢之後,計算他和每個顯式的查詢的相似度就可以用傳統的方法了。這裏用鄰居來進行擴展的原因就是擴展之後的每個顯式查詢都會有一些隱式的特徵在裏面。

 

最後將兩種方法線性組合起來,就能夠對於一個查詢得到一個排序的顯式的查詢候選了。

 

評測

用了人工打分的方式,對30個查詢的意圖建議進行分類,將他們分爲體現了用戶的意圖和完全沒有體現這兩類。結果顯示有71%的查詢擴展都很有效。

 

初步結果

將要討論兩種潛在的影響:搜索結果的多樣化點擊率。比如現在的搜索引擎大多追求的是儘量對於一個查詢包含更多的他的方面。我們可以考慮到,如果一個有顯式意圖的查詢結果有多樣性,那麼經過意圖建議之後的查詢結果應該更加的集中。點擊率通常用來評價大文檔集合的相關性,我們期望的是通過讓用戶的查詢更加的顯示化,能夠增加點擊率。

結果用了對比的方法,一個對比是Yahoo的擴展系統,通過擴展之後的結果的平均交集大於通過意圖擴展。這說明意圖建議能夠讓搜索的結果變得更加的多樣性,也就是傳統的查詢新引入的結果佔原來結果的很小一部分。然後還對比了兩種方法的各個擴展之間的區分,結果顯示yahoo的各個擴展之間的交集大於意圖建議的交集。這個說明了意圖建議的查詢能夠得到更加多樣化的結果,而且每個擴展的結果更加的集中。對於點擊率的實驗是採用了不同長度的查詢的點擊率。我們感興趣的是長度是5的統計,因爲經過統計顯式意圖集合的平均長度是5.33個詞。結果顯式在5個詞查詢中,點擊率提高了30%左右。也就是結果和查詢更相關,導致了更多的點擊率。

 

這個論文將意圖分類的問題用到了實際應用中。這個論文中沒有涉及到一個查詢的分類問題,而只是結用了“意圖”這個說法,然後在“意圖”的角度來改善了查詢擴展或者查詢建議的系統。結果顯示,讓用戶的查詢更加的顯式一方面能夠使查詢結果更加的多樣化,並且通過建議再查詢能夠讓查詢結果集中化。另一方面使能夠使查詢結果的點擊率得到提高,也就是查詢結果的相關性得到提高。

 

發佈了42 篇原創文章 · 獲贊 0 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章