原创 使用NDCG評估關鍵詞推薦系統的相關性

對於傳統推薦策略, 我們在驗證其效果的時候, 一般會採用以下流程驗證其實驗效果: offline 的評測: 思路基本和傳統機器學習的思路類似, 例如在推薦算法中我們直接使用AUC,F2等評估模型效果一樣, 線下使用測試數據就能知道算

原创 如何使用機器學習解決實際問題-以關鍵詞相關性模型爲例

本文以百度關鍵詞搜索推薦工具字面相關性模型爲基礎,介紹一個機器學習任務的具體設計實現。包括目標的設定,訓練數據準備,特徵選擇及篩選, 以及模型的訓練及優化。該模型可擴展到語意相關性模型,搜索引擎相關性及LTR學習任務的設計實現。該模型的

原创 context-aware recommendation

智能手機的普及讓大家隨時隨地都可接入互聯網,而這樣的隨時隨地的應用場景,也讓傳統推薦技術需要充分考慮,利用這些信息提升推薦的準確性,同時從另外一方面考慮, 這種符合LBS的推薦, 因爲有了這些信息後,也能夠更加準確。 傳統的推薦系統基

原创 關鍵詞推薦工具中的用戶引導機制之三:相關搜索query技術

在上一篇《關鍵詞推薦工具中的用戶引導機制之二:suggestion架構》中, 我們提到, 在用戶在搜索引擎,或是關鍵詞推薦工具中輸入搜索query片段的過程中, 我們可以提供suggestion來對用戶搜索進行引導。 我們可以認爲

原创 集成樹類模型及其在百度搜索推薦系統中的應用

決策樹是經典高效的機器學習分類算法, 非常適用於線性模型效果不能滿足需求, 規則描述分佈比較合適的場景。而決策樹與傳統bagging, boosting思想結合在一起, 就形成集成樹模型方法, 包括Random Forest,GBDT等

原创 推薦系統經典論文文獻及業界應用

列了一些之前設計開發百度關鍵詞搜索推薦引擎時, 參考過的論文, 書籍, 以及調研過的推薦系統相關的工具;同時給出參加過及未參加過的業界推薦引擎應用交流資料(有我網盤的鏈接), 材料組織方式參考了廠裏部分同學的整理。 因爲推薦引擎不能算

原创 級聯二步圖關係挖掘關鍵詞推薦系統及實現代碼

youtube使用簡單的共現思路, 實現視頻的高效推薦。 受到該思路的啓發, 我們基於百度鳳巢廣告主在廣告庫中提交的關鍵詞, 更進一步設計出可級聯的二部圖關係挖掘算法框架, 實現億量級關鍵詞, 千萬級別用戶(單元結構)的高效推薦。 本文

原创 百度在 2013 年是衰落的嗎?是有怎樣的依據?

知乎上受邀回答問題:“百度在 2013 年是衰落的嗎?是有怎樣的依據?” 正好在做自己個人的年度總結及明年的規劃, 那也順便分析下公司今年的情況。 我的觀點: 2013年百度各業務發展勢頭都還算不錯,中規中矩, 沒看出特別出彩, 但完

原创 管理者如何做好團隊規劃

之前看過一篇文章,講述的是孫正義如何設定目標及如何達成目標, 具體的原話忘了, 大概的思路是: 先設想自己10年後想達成的狀態和目標,之後再分析要達到這個目標, 在第8年的時候需要哪些資源, 需要達成怎樣的狀態, 之後不斷倒推, 直到當

原创 epoll機制在搜索引擎spider中的應用

本文將介紹epoll的概念,原理, 優點,及使用接口,同時結合作者在搜索引擎spider開發中epoll使用方式的代碼向大傢俱體介紹epoll的使用方式。 P.S. 筆者08年曾有使用epoll編寫未考慮壓力控制的crawler,將國

原创 百度搜索引擎變現策略指標體系

下文就百度商業變現的指標體系進行概要描述,並針對一個類似於百度LBS系統的變現思路,闡述一個商業系統變現策略指標體系的建立過程。 爲什麼需要商業變現策略指標體系 一般情況下,一個互聯網產品,或是一個移動端產品在發展前期,主要會關注流

原创 關鍵詞推薦工具中的用戶引導機制之四:種子query推薦

上一篇《關鍵詞推薦工具中的用戶引導機制之三:相關搜索query技術》中, 我們提到可使用用戶query-點擊日誌,session數據,及網頁內容,挖掘與query意圖相關(同時具有變現價值)的相query推薦給客戶引導用戶優化搜索。

原创 一個完整推薦系統的設計實現-以百度關鍵詞搜索推薦爲例

在之前一篇博文中, 有同學在評論中問了個問題: 如何解決因式分解帶來的推薦冷門,熱門關鍵詞的問題。 在回答這個問題的時候, 想到了近幾年在做搜索推薦系統的過程中, 學術界和工業界的一些區別。 正好最近正在做技術規劃, 於是寫偏文章說

原创 因式分解實現協同過濾-及源碼實現

在設計實現推薦系統,選擇推薦算法時, 肯定會考慮協同過濾(CF)的使用,而CF中經常使用的兩種方法包括: neighbour-based方法和因式分解。 作爲一個搜索推薦系統,百度關鍵詞系統中也使用了CF(包括neighbour-bas

原创 如何與理智的對手溝通談判

很早前讀了《談判力》這本書,當時覺得非常棒,基本的原則,就是兩點: 所有的談判, 都要以人爲本所有的談判, 都以客觀的標準進行咋一看這兩個點是矛盾的,如果所有談判都基於客觀標準進行, 那是不是還需要考慮人的感受?    這就會涉及到剛