搜索引擎認識

        在csdn和風行資訊網都看到了這些內容,主要介紹了第二代搜索引擎的相關缺點和第三代搜索引擎的大致輪廓。google的pagerank算法可以算得上是第二代搜索引擎的典型代表了。同時列舉了第二代搜索引擎的相關侷限,主要敘述了以下四個方面:(1)提供的提問函數相當有限。例如,雅虎只提供與、或運算,並且一旦選用了一個邏輯運算符,即必須應用於所有的關鍵詞;再如,百度搜索僅支持與、或、非布爾表達式,而不支持異或,也不支持關鍵詞之間的位置檢索或者勾選搜索結果。(2)僅支持單個關鍵詞或者一組關鍵詞及邏輯運算符組成提問,而並不支持自然語言搜索或語義搜索。以百度爲例,百度搜索支持字串搜索,當用戶輸入一段話進行查詢時,百度會將其切分成多個詞,按照邏輯“與”的關係進行關鍵詞搜索,但搜索結果充其量僅能做到差強人意。所以如此,是因爲關鍵詞搜索本身並不是基於對內容的理解,所以關鍵詞與搜索結果之間的匹配很難做到精準,往往是搜到哪算哪。(3)不能利用歷史信息進行搜索。用戶的每次搜索都是從頭開始,而不能從原有的查詢結果中作進一步選擇;(4)呈現方式單一、呆板。多數搜索引擎只返回一個長長的搜索結果列表,其中可能有數以萬計的包含關鍵詞的網頁,但這些網頁是否以及在多大程度上與用戶的搜索意圖相關,則不得而知。

         同時還對第三代搜索引擎進行相關預言。(1)更精準、更個性化的搜索:借鑑Autonomy的模式識別技術以及自動分類等功能,如Clusty、Grokker、Snap、Dogpile;在美國頗受用戶讚譽的另一個搜索引擎swicki;這種搜索方式就是自動分類、聚類等功能。(2)呈現方式:如Google趨勢搜索以及百度指數;需要語義分析技術和部分人工智能技術。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章