搜索引擎算法之 Query Tagging

 

根據搜索查詢語料來標註詞性標籤。基於統計的方法來做。

搜索:budget rent a car

搜索結果:結果名字不符的詞性。

 

    根據統計:基礎結果π(t|w)  和  上下文中的結果φ(t|w,s)  

 

 

word 特徵:左鄰居個數、右鄰居個數、0-1後綴特徵、0-1形狀特徵

分佈特徵:Distributional features. We follow a long tradition of older (Finch and Chater, 1992; Schütze, 1993; Schütze, 1995) and newer (Huang and Yates, 2009) work on creating distributional features for POS tagging based on local left and right neighbors.

形狀特徵:數字、大小寫、ed、ing結尾

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章