百度被裁員工投奔對手 競業限制或失效

百度被裁員工投奔對手 競業限制或失效
(作者:王宏亮       來源: TechWeb.com.cn )
     

    繼百度企業搜索部門裁員30人之後,另一家搜索引擎廠商中國搜索也傳出裁員的消息。有消息稱,中搜此番裁員將主要集中在非IG(個人門戶)部門,整體裁員比例可能高達40%。一年前,爲了給個人門戶業務讓路,中搜已停掉了企業搜索業務。

  在接受媒體採訪時,中搜總裁陳沛確認了將有人員調整的消息,但對具體裁員數字則顧左右而言他。

  戲劇性的是,在中搜裁員傳聞尚未塵埃落定之際,百度被裁員工的去向卻有了着落。消息人士透露,百度ES部門的多名離職員工日前已投奔企業搜索巨頭Autonomy中國公司,其中既有市場銷售人員,也有技術人員。

  據瞭解,儘管百度在此次裁員行動前曾與ES部門員工簽署競業限制協議(也稱同業禁止協議),規定員工離職1年內不得進入競爭對手的公司工作,但在7月10日的裁員行動中,百度並未按照勞動法相關規定向離職員工支付競業限制補償金,而只是按N+1標準補發了相應工資,對部分有期權的員工也只補發了一個月的期權。這意味着百度當初與員工簽訂的競業限制協議已自動失效。同時,由於百度已經關閉了企業搜索軟件和相關服務部門,因此百度與Autonomy之間已不存在同業競爭關係。

  圍城效應

  形成對照的是,在中搜、百度紛紛從企業搜索領域戰略撤退的同時,Google、微軟、IBM等卻摩拳擦掌,相繼在該領域投入重兵,而企業搜索的老牌勁旅Autonomy、Fast等則擁兵自重,一路穩紮穩打,張弛有致地擴充着勢力範圍。

  Google方面,其企業軟件目前雖然僅佔總收入的極小比例,但已將企業搜索引擎視爲“解決利益問題的戰略據點”( Google首席執行官埃裏克.舒米特語)。從2002年迄今,Google先後推出了企業搜索設備GSA、OneBox、Google Mini等多款產品,並通過在其中捆綁Gmail、企業級桌面搜索工具等產品模塊,以整合的產品模塊、頗具誘惑力的低格、極爲簡便的許可模式,在企業搜索領域連連攻城拔寨。2005年,Google從企業搜索業務中獲取的收入達到了7500萬美元。雖然相比於Autonomy同期2.7億美元的銷售收入仍有距離,而且其桌面搜索工具的推出要晚於Autonomy整整10年,但憑藉其強大的品牌優勢,Google此番來勢之兇猛,依然令人瞠目。

  將企業搜索市場視爲禁臠之地的不只是Google,微軟COO凱文•特納(Kevin Turner)就曾放話說:“企業搜索是我們的地盤,Google不應該插手。”

  Autonomy也沒閒着。繼去年斥資5億美元購併Verity之後,Autonomy一面在國內祕密部署視頻搜索門戶,一面則極力拼搶企業級市場。據悉,近期該公司將同時發佈三大系列專門針對中國市場的應用產品,分別是面向企業的“企業競爭情報智能分析系統”、面向政府部門的“互聯網輿情監控分析系統”和麪向中小企業的一款名爲“ultraseek”的低端搜索產品。

  算法優劣論

  以Google的PageRank算法和百度的超鏈分析爲代表的關鍵詞搜索引擎技術在大型的、結構化的網絡搜索中取得了空前成功,但是在結構更爲緊密的企業管理系統中,該算法在索引、安全以及關聯操作上,仍存在若干侷限。

  如所周知,PageRank算法基於如下假設:指向一個網頁的鏈接越多,這個被指向的網頁的相關性及權重就越高,從而也就會排在更靠前的位置。百度的超鏈分析與此稍有不同。除了文件本身對關鍵詞的引用外,超鏈分析還考慮了反向鏈接中的關鍵詞。當一個關鍵詞被搜索時,含有以關鍵詞爲鏈接文字的反向鏈接數目最多的那個文件或網頁,將被作爲最相關的結果排在前面。

  上述算法在網頁搜索方面很有效,特別是憑藉布爾表達式查詢的時候,但在搜索結果的呈現方式如自動關聯、自動分類、自動聚類、個性化建檔等方面,則可說建樹不多。

  不妨來看看Autonomy的做法。Autonomy的算法基於一種專有的模式匹配技術,可根據單詞或詞語的出現頻率來識別不同文本在上下文環境中的語義,並以此判斷一篇文檔與某個主題的相關度。通過這種方法,Autonomy可抽取文檔中的文本要素,自動識別文本的概念。也因此,該算法 本身兼具了某種程度的語義搜索功能,同時也克服了PageRank算法中關鍵詞之間沒有重要性差別、也不支持語義搜索和自然語言搜索的缺陷。

  也是因爲基於模式匹配和概念搜索的算法,Autonomy可抽取文檔中包含的重要概念自動進行聚類,將相似的文檔聚類到一起並自動生成類別的標題。該算法還可以自動對信息進行分類,自動標引,並基於用戶興趣自動匹配出個性化、多側面的直接檔案和隱含檔案(通過點擊和提交)。固然,傳統關鍵詞搜索也支持自動分類,但由於使用的是傳統SVM和KNN算法進行分類,在分類效率和準確率上僅可做到差強人意。

  模式識別算法還可以對文檔中最主要的概念進行動態摘要,依據用戶的興趣所在和相關性權重值的不同,每次摘要的內容可以是不同的,而關鍵詞搜索只能生成固定的摘要信息,且摘要信息往往不連貫,甚至無法卒讀。

  此外,模式識別算法也可以分析信息間的主要關係,從而實現內容間的交叉索引對照和自動關聯,並實時生成超鏈接。當文檔被查閱時,這些鏈接可以自動一次性插入到文檔中,因此可以將以前寫的文檔作爲當前文檔的參考,檔案資料也可以鏈接到最新的新聞或相關資料。而關鍵詞算法則是基於矩陣模型的相關文件分析,處理效率取決於文章大小和文章數量。基本上,文章數一超過10萬量級,搜索響應速度就會受到影響。

  不過有跡象表明,Google、百度、微軟等關鍵詞搜索廠商正在着力修補自身的搜索模型,爲之增加更多的變量,並在探索更個性化、更具有相關性的呈現方式。一個例子是百度指數和Google趨勢中文版的先後上線。作爲一種顯示關鍵詞搜索量隨時間走勢變化的應用,二者可視爲百度和Google在個性化搜索領域的初步嘗試。有意思的是,此前數年Autonomy推出的二維島圖、三維信息圖等圖形化搜索結果聚類呈現方式,與此頗多神似之處。

  更多的信息顯示,Google、IBM已在研發自然語言搜索、語義搜索等第三代搜索技術,微軟MSN部門已在研發智能問答式搜索、個性化搜索、個性化用戶界面等技術領域,而雅虎和百度則在社會化搜索、社區搜索領域走在了前面。
 

發佈了17 篇原創文章 · 獲贊 1 · 訪問量 11萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章