什麼是垂直搜索-全面瞭解垂直搜索引擎

垂直搜索是針對某一個行業的專業搜索引擎,是搜索引擎的細分和延伸,是對網頁庫中的某類專門的信息進行一次整合,定向分字段抽取出需要的數據進行處理後再以某種形式返回給用戶。
  

垂直搜索引擎和普通的網頁搜索引擎的最大區別是對網頁信息進行了結構化信息抽取,也就是將網頁的非結構化數據抽取成特定的結構化信息數據,好比網頁搜索是以網頁爲最小單位,基於視覺的網頁塊分析是以網頁塊爲最小單位,而垂直搜索是以結構化數據爲最小單位。然後將這些數據存儲到數據庫,進行進一步的加工處理,如:去重、分類等,最後分詞、索引再以搜索的方式滿足用戶的需求。
  

整個過程中,數據由非結構化數據抽取成結構化數據,經過深度加工處理後以非結構化的方式和結構化的方式返回給用戶。
   

垂直搜索引擎的應用方向很多,比如企業庫搜索、供求信息搜索引擎、購物搜索、房產搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索……幾乎各行各業各類信息都可以進一步細化成各類的垂直搜索引擎。
   

舉個例子來說明會更容易理解,比如購物搜索引擎,整體流程大致如下:抓取網頁後,對網頁商品信息進行抽取,抽取出商品名稱、價格、簡介……甚至可以進一步將筆記本簡介細分成“品牌、型號、CPU、內存、硬盤、顯示屏、……”然後對信息進行清洗、去重、分類、分析比較、數據挖掘,最後通過分詞索引提供用戶搜索、通過分析挖掘提供市場行情報告。
  

垂直搜索引擎大體上需要以下技術
    1.Spider
    2.網頁結構化信息抽取技術或元數據採集技術
    3.分詞、索引
    4.其他信息處理技術


   垂直搜索引擎的技術評估應從以下幾點來判斷
    1.全面性
    2.更新性
    3.準確性
    4.功能性


垂直搜索的進入門檻很低,但是競爭的門檻很高。沒有專注的精神和精湛的技術是不行的。行業門戶網站具備行業優勢但他們又是沒有技術優勢的,絕對不要想像着招幾個人就可以搞定垂直搜索的全部技術,作爲一個需要持續改進可運營的產品而不是一個項目來說對技術的把握控制程度又是垂直搜索成功的重要因素之一


垂直搜索引擎是相對通用搜索引擎的信息量大、查詢不準確、深度不夠等提出來的新的搜索引擎服務模式,通過針對某一特定領域、某一特定人羣或某一特定需求提供的有一定價值的信息和相關服務。其特點就是“專、精、深”,且具有行業色彩,相比較通用搜索引擎的海量信息無序化,垂直搜索引擎則顯得更加專注、具體和深入。

垂直搜索引擎能否贏得市場?
垂直搜索引擎爲用戶提供的並不是上百甚至上千萬相關網頁,而是範圍極爲縮小、極具針對性的具體信息。因此,特定行業的用戶更加青睞垂直搜索引擎,是垂直搜索引擎的長期、穩定的羣體。

中國十年多來互聯網的不斷髮展,造就出1.3億的網民,搜索引擎也出現空前的火熱。在互聯網出現的初期,雅虎、新浪網易等大型門戶網站擁有着絕對多的瀏覽量,原因在於當初的大部分網站在技術上無法與門戶網站相媲美,多數質量較差,內容不豐富,所以大型門戶網站優秀的網頁設計風格,大量的信息及時更新贏得了用戶的認可,創造了第一次互聯網的高峯。然而隨之近年來網絡技術的普及與應用,建立一個專業的網站已經不存在太多的技術門檻。於是看好互聯網前景的網站紛紛涌現在我們的面前。相對比而言在某些領域中,大型門戶網站的頁面風格反而不如一些中小型網站的界面漂亮,同時各種分類的行業網站也慢慢的興起,也使得門戶網站的專業性信息遠遠難以相論,如此一來導致了流量的分流,衆多的商家也逐漸意識到互聯網商機並不像當初抄做的那樣有實際價值。於是互聯網第一次危機出現,這也是互聯網發展的必然趨勢。

搜索引擎的出現,整合了衆多網站信息,恰恰起到了信息導航的作用。通用搜索引擎就如同互聯網第一次出現的門戶網站一樣,大量的信息整合導航,極快的查詢,將所有網站上的信息整理在一個平臺上供網民使用,於是信息的價值第一次普遍的被衆多商家認可,迅速成爲互聯網中最有價值的領域。互聯網的低谷由此演變爲第二次高峯。大家熟知的搜索引擎Google、百度、雅虎等是通用搜索引擎現如今的傑出代,他們爲互聯網的發展做出了重要的貢獻。然而,搜索引擎行業也不是一家公司就可以獨撐天下的,從百度的上市、yahoo中國的併購一系列動作表明,如今的搜索引擎大戰如同門戶網站初期的競爭一樣激烈。相信,通用搜索引擎在經歷過一段時間的角逐後,也將會繼續維持幾大服務商各自分控一部分市場的局面。

垂直搜索引擎概念的提出,就是針對性的爲某一特定領域、某一特定人羣或某一特定需求提供的有一定價值的信息和相關服務。可以簡單的說成是搜索引擎領域的行業化分工。衆多專業性網站、行業網站獨立服務於互聯網的成功,恰恰證明了互聯網的格局應該是多方面的。通用搜索引擎的性質,決定了其不能滿足特殊領域、特殊人羣的精準化信息需求服務。市場需求多元化決定了搜索引擎的服務模式必將出現細分,針對不同行業提供更加精確的行業服務模式。可以說通用搜索引擎的發展爲垂直搜索引擎的出現提供了良好的市場空間,勢必將出現垂直搜索引擎在互聯網中佔據部分市場的趨勢,也是搜索引擎行業細分化的必然趨勢。


1、垂直搜索引擎不是什麼?
垂直搜索不只是類google的行業通用搜索。以房產行業爲例,如果我們按照google抓取網頁的方式,來建造一個房產行業google的做法,是行不通的。技術壁壘不用解釋,就算我們藉助nutch,lucene等搜索技術來做,我們也無法提供差異化的服務,而沒有差異化的產品在互聯網贏家通吃的規則下是無法生存的,就是不要簡單地模仿,而要想辦法形成互補。
垂直搜索和目前的google,baidu等通用搜索從定位,內容,用戶,市場策略等都是不同的。所以垂直搜索不只是簡單的行業google。

用戶使用google,baidu等通用搜索引擎的方式是通過關鍵字的方式實現的,是語義上的搜索,返回的結果傾向於知識成果,比如文章,論文,新聞等;垂直搜索也是提供關鍵字來進行搜索的,但被放到了一個行業知識的上下文中,返回的結果更傾向於信息,消息,條目等。對買房的人講,他希望找的房子供求信息和文章,新聞等不同。這個特性是他們各自的的技術特點決定的。打個比方,如果google搜索引擎是一個正金字塔型,那麼垂直搜索引擎就是個倒金字塔型,兩者是互補的。


2、垂直搜索是什麼?
我認爲:垂直搜索的本質是對垂直門戶信息提供方式的一次簡化性的整合。
搜索領域有句明言:就是用戶無法描述道他要找什麼,除非讓他看到想找的東西,這個過程有點像找對象,碰運氣是用戶搜索行爲的最大的特徵。而垂直搜索引擎就是提高爲用戶提供更好的運氣。

垂直搜索是服務於某項功能的,比如:用戶搜索租房,買房信息就是一種垂直搜索。對信息的再加工處理是非常關鍵的,不管是結構化的數據,還是非結構化的數據。


3、垂直搜索的內容來源:
A門戶網站自身的資源
B以開放接口方式讓行業用戶提供的資源
C普通用戶發佈的資源
D抓取行業用戶的資源

微軟亞洲研究院負責搜索的一名技術專家說:75%的內容通用搜索引擎搜索不出來。這裏麪包含2層含義:

(1)網站結構不合理,網頁對搜索引擎不友好;
(2)由於信息在互聯網是海量的,非結構化的信息需要經過結構化的梳理後才能更好的展現。 如果梳理者能提供搜索,那樣會更好。而垂直門戶網站就是行業信息最好的梳理者。 垂直搜索引擎提供的主要內容不應該侷限於普通的網頁索引,而且包括商業信息的加工,結構化的信息。

4、進入垂直搜索的門檻在那裏?
在互聯網上說門檻,就是比資源。垂直搜索也是這樣,能否提供全面權威的行業信息,能否擁有行業資源是垂直搜索引擎發展的門檻。換句化說,垂直門戶是垂直搜索血統最近的父親。作爲房產行業的搜房網就是一個垂直門戶,在房產領域沒有誰比我們更清楚什麼是垂直搜索了。
垂直搜索的難點不是技術,而是用戶參與門戶網站行爲的創新和垂直門戶網站對產業上下游信息資源的整合。

5、垂直搜索的特點:
(1)、搜索是一個產業商業聯盟的平臺,一個集成產業鏈的上下游公司的搜索門戶。
(2)、垂直搜索的表現方式和google,baidu的表現方式不同,結構化的搜索和非結構化搜索並用。
(3)、從廣告模式上 提供了除 google adsense 和 百度競價排名廣告 之外的另一種可能。

6、垂直搜索引擎的三個特點:

(1)、垂直搜索引擎抓取的數據來源於垂直搜索引擎關注的行業站點:
比如:找工作的搜索引擎www.deepdo.com的數據來源於:www.51job.com,www.zhaoping.com,www.chinahr.com等等;
股票搜索引擎www.macd.cn的數據來源於:www.jrj.com.cn,www.gutx.com等股票站點;
(2)、垂直搜索引擎抓取的數據傾向於結構化數據和元數據:
比如:我們找工作關注的:
職位信息: 軟件工程師
公司名稱,行業名稱:軟件公司,外包行業等;
地點:北京,海淀;
(3)、垂直搜索引擎的搜索行爲是基於結構化數據和元數據的結構化搜索:
比如: 找:海淀 軟件工程師 的工作等。

7、垂直搜索引擎站點的8條準則:

1、選擇一個好的垂直搜索方向。俗話說男怕選錯行,這一點對於搜索引擎來說也是一樣的,除了選擇的這個行業有垂直搜索的大量需求外,這個行業的數據屬性最好不要和
Yahoo,Google等通用搜索的的抓取方向重疊。
目前熱門的垂直搜索行業有:購物,旅遊,汽車,工作,房產,交友等行業。搜索引擎對動態url數據不敏感也是衆所周知的,這些可以作爲垂直搜索引擎的切入點;

2、評價所選垂直搜索行業的網站、垂直搜索內容、行業構成等情況:
我們都知道垂直搜索引擎並不提供內容來源,它的數據依賴爬蟲蒐集,並做了深度加工而來的。因此考慮垂直搜索引擎的所處的大環境和定位至關重要。


3、深入分析垂直搜索引擎的索引數據特點:
垂直搜索引擎的索引數據過於結構化,那麼進入的門檻比較低,行業競爭會形成一窩蜂的局面;如果搜索數據特點是非結構化的,抓取,分析這樣的數據很困難,進入壁
壘太高,很可能出師未傑身先死。


4、垂直搜索引擎的索引數據傾向於結構化數據和元數據,這個特點是區別於yahoo,google等通用搜索引擎的,這是垂直搜索引擎的立足點。而垂直搜索引擎是根植於某一個行業 ,因此行業知識,行業專家這些也是通用搜索引擎不具備的。也就是說進入垂直搜索是有門檻的。


5、垂直搜索引擎的搜索結果要覆蓋整個行業,搜索相關性要高於通用搜索引擎,貼近用戶搜索意圖,搜索結果要及時。


6、垂直搜索引擎的web 2.0 需求:
垂直搜索引擎的搜索數據由於帶有結構化的天性,相對於通用搜索引擎的全文索引而言,更顯的少而精。因此,設計的時候要提供收集用戶數據的接口,同時提供tag,積
分等機制,使搜索結果更加“垂直”。


7、垂直搜索引擎的目標是幫助用戶解決問題,而不只是向通用搜索引擎一樣發現信息:
這一點是垂直搜索引擎的終極目標。 在做垂直搜索引擎的時候你需要考慮:什麼問題是這個行業內的特殊性問題,什麼問題是一般性問題。keso多次提到google的目標是
讓用戶儘快離開google,而垂直搜索引擎應該粘住用戶。一般來說,使用垂直搜索引擎的用戶都是和用戶的利益需求密切相關的。所謂利益需求是我自己獨創的,大意是和用戶工作密切相關,生活中必不可少的需求,而求有持續性。比如:學生找論文,業主找裝修信息等等這樣的需求。因此粘住用戶,讓用戶有反饋的途徑是一個關鍵部分。


8、垂直搜索引擎的社區化特徵:
這一條和第9條是相關的。
俗話說物以類聚,人以羣分,垂直搜索引擎定位於一個行業,服務於一羣特定需求的人羣,這個特點決定了垂直搜索的社區化行爲。人們利用垂直搜索引擎解決問題,分享回饋。現在做網站都講求社區化,所以垂直搜索引擎本質上還是:對垂直門戶信息提供方式的一次簡化性的整合。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章