今天機緣巧合,剛巧嘗試用了下360的搜索引擎:http://www.so.com
並沒有專業的評測,結合自己對百度搜索的瞭解,簡單記錄些體會:
1 360的類聚系統
站點類聚和內容類聚的結果,和百度搜素的結果居然一模一樣。懷疑這種現象有兩種可能,一種是360採用了百度相同的類聚代碼,一種是360在搜索結果上爬取並參考了百度的搜索結果。
2 360後臺的索引長度
google的query結果是1000條;百度在此基礎上收縮爲760條(即所謂的760庫);360進一步縮減爲了640條結果;這樣的收縮能讓360適當減少AC、BC等模塊的倒排索引運算量,會節省一些服務器資源;並且和百度也有些差異
3 spider的比較
360和百度的索引各有千秋,在有些低頻query上360的索引量居然還多一些,有點出乎意料。
4 廣告系統
360目前CPC用的還是google的搜素廣告系統,內部研發的系統不知道什麼時候會上線替換。
考慮到鳳巢可是百度收入的絕對大頭,從這個角度來看360的股票還有不少上漲的潛力
5 query分析
百度做得力度更大一些,在query分析和query變換上更豐富,
360做得比較少,這方面屬於慢工出細活,可以慢慢趕上
6 超長query的處理
百度還是限制query的長度只允許38個漢字以內,360略微擴展到了40個漢字。
超長query下百度的飄紅系統出了問題,並且後面出了非常不相關的搜索結果,360在方面的效果居然比百度要出色一些。長query一直是百度的短板,也是技術難度大的一個方面,這方面有我們的外國老師Google做得很好,值得多學習
7 英文搜索
360和百度都很爛,完全沒放精力。碼農朋友們如果要搜技術資料還是用Google靠譜得多
8 社區類產品
百度的一系列社區類產品,包括百度百科、百度知道等,內部的同學們都知道,是百度大搜索系統的神器。
百度百科更多面向高頻query,只要命中了相關性通常有保證;百度知道是低頻query和長query的救星,在很多場景下,由於query分析不夠深入,導致優質結果無法召回的時候,就靠百度知道來救場了。
360在這方面實在吃了大虧,百度對360鏈接過來的結果要作二次跳轉,比較噁心,如下圖
9 阿拉丁系統
360的360良醫直達做得不錯,這也是360針對百度醫藥廣告多而開發的亮點功能。但百度在阿拉丁的query覆蓋率上要更勝一籌。另外百度地圖的確好很多
10 整體觀感
360作爲一個有力的競爭者,發展得很不錯。
但是IT行業是一個勝者通吃的世界,作爲追趕者,要想超越,只做模仿遠遠不夠,還得想辦法有顛覆性的功能創新點才行。我們拭目以待