搜索00 倒排索引結構


倒排索引結構
倒排索引結構中一個基礎概念詞項.詞項是邏輯學中的基本概念之一.是邏輯分析的基本單元.英文翻譯是Term.詞項與"詞"意義類似,但又不是完全一樣,存在一定的差別.
倒排索引與正排索引,他們之間不同的是倒排索引的索引項是詞項.正排索引的索引項是文檔.

當你在搜索引擎中輸入"光年論壇"的時候,這個光年論壇本身就是一個詞項.
但是如果"光年論壇"本身並不是一個獨立的詞項,就會被切分成"光年","論壇"兩個詞項.

根據百度的統計,一般國內用戶都會通過3-4個詞項來搜索信息.
這個時候,當我們設計網站的長尾結構時,就可以通過對詞項的瞭解進一步優化頁面中的內容佈局.

倒排索引是頁面是否會出現結果中的一個重要判斷.
當然還有頁面質量,頁面更新時間等因素來做出綜合判斷.

但是對於一個非常小的詞來說,如果你的某些頁面沒有相應的得到排名,剔除一些外鏈等因素..可以單純的利用詞項來分析獲得頁面本身詞項匹配度和重要性.從而通過單純的信息內容結構來進行第一次優化.簡單的說,可以把關鍵詞靠前一些.深入的說,就是利用詞項的特點,來改變內容的一些結構和上下文順序,不影響閱讀的情況下,更加直觀的令搜索引擎更加重視.

如果是多個詞項的搜索, 系統會通過排除干擾的方式,自動優化搜索的目的,從而通過多個詞項的順序和語法特性獲得詞項的索引內容.
"光年論壇"中
"論壇"是類型描述詞
"光年"是特殊定位詞

那麼按照優先順序,應該先倒排"光年",而後倒排"論壇"
目前有四種倒排組合.
"光年" -> “論壇”
"論壇" -> "光年"
"光年" + "論壇"
"論壇" + “光年”

到底是用那種組合,需要分析更多的點擊行爲來糾正判斷組合..
這個倒排索引結構 屬於 內容優化的範疇內..
存在頁面DOM結構性的位置優化,也存在於完整的內容區塊中的語法位置優化.

很多優化BAIDU的朋友 都喜歡在網頁代碼中最頂部<bogy>下 寫一段內容....
很多人說越靠前,越好...
其實是...被搜索詞項相對位置靠前,提高了索引列表中位置..
相反的思考..
一個頁面中...某些詞項的位置與重複度決定了頁面的定位...同時還決定了導出鏈接的相關性..
網頁的內容是冰山,核心的詞項纔是應該露出來的..
設計單個頁面的時候,如何突出某些長尾(組合詞項)的排名,需要用心的思考下了...

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章