原创 推薦算法總結(召回+排序+工程化)

文章目錄召回內容召回word2vecLDA行爲召回ItemCFUserCFSwing關聯規則聚類協同矩陣分解隱語義LFM圖召回PersonalRank圖嵌入圖神經網絡模型召回item2vec(embedding)FM模型召回雙塔模

原创 點擊率CTR修正方法——威爾遜區間

由於原始CTR計算方式只考慮了相對值,沒有考慮絕對值。即,沒有考慮曝光的數值大小,在曝光少的情況下,計算出的CTR其實不可靠,樣本充足的情況下,才能反應真實情況 舉例: A:點擊數 5 曝光數 10 B:點擊數 50 曝光

原创 推薦系統實踐——阿里B2B

文章目錄商品召回排序內容推薦未來工作 本文參考DataFunTalk 發展歷史 商品召回 I2I召回和U2I召回 2. Deep Match U2I召回 在Youtube Deep Match的基礎上,基於序列上下文的A

原创 面試準備——操作系統複習

文章目錄進程和線程以及它們的區別進程間的通信的幾種方式線程同步的方式什麼是死鎖?死鎖產生的條件?進程有哪幾種狀態線程有幾種狀態 進程和線程以及它們的區別 系統進行資源調度和分配的的基本單位,實現了操作系統的併發; 線程是進

原创 用矩陣分解來解決推薦問題

文章目錄整體架構分部細節生成訓練數據bm25矩陣分解lightfm 整體架構 讀取數據 訓練模型 分部細節 生成訓練數據 從hadoop生成兩個子文件 (1)docid,pv,cl (2)mid,cl_docid_durati

原创 面試準備——計算機網絡複習

文章目錄Http和Https的區別三次握手四次揮手Get與POST的區別TCP與UDP的區別TCP的擁塞處理從輸入網址到獲得頁面的過程Session、Cookie 與 ApplicationOSI網絡體系結構與TCP/IP協議模型

原创 自然語言處理知識梳理

文章目錄word2vectextcnnBi-LSTMBi-LSTM + Attentionseq2seqattention+Seq2seqTransformer word2vec from gensim.models import

原创 git基本的操作總結

文章目錄基本操作分支管理撤銷修改 簡單介紹一下工作中會用到的git操作 基本操作 創建倉庫 直接在github上創建 下載倉庫 git clone http://xxxxxxxx.git 查看遠程倉庫信息 git rem

原创 推薦算法知識梳理

文章目錄架構介紹推薦系統架構介紹召回簡單介紹非個性化召回多路召回模型召回雙塔模型因子分解發散點用戶行爲序列召回改進用戶多興趣拆分知識圖譜融合召回圖神經網絡模型召回排序技術發展趨勢模型表達能力顯示特徵組合特徵抽取器的進化AutoML

原创 如何讓推薦列表不要千篇一律?——重排算法MMR

MMR原理 QQQ : 用戶; DDD : 推薦結果集合; SSS : RRR中已被選中集合; KaTeX parse error: Undefined control sequence: \S at position

原创 推薦系統實踐——知乎如何做首頁rank

文章參考「回顧」知乎推薦頁Ranking經驗分享 文章目錄推薦頁請求流程ranking演進特徵介紹CTR模型DNNDeep FMLast View + DINLast Display + GRU多目標優化最終模型結構經驗分享面臨問

原创 推薦算法如何做多目標優化

文章目錄阿里 ESMM阿里 DUPN美團"猜你喜歡" 深度學習排序模型Google MMoE阿里 ESM2YouTube 多目標排序系統美圖小結 推薦系統中如果只優化ctr,那麼有很多已有的ctr預估模型可以做。但是往往一個優秀的

原创 推薦算法——冷啓動算法調研

文章目錄討論內容平臺準備其他平臺信息整合做好文章畫像產品設計新用戶到來初期豐富用戶畫像,基於內容推薦上下文推薦熱度排序快速試探冷啓動用戶操作一段時間後評估冷啓動效果判定冷啓動階段結束策略遷移一些討論冷啓動結束判定推薦系統收斂性問題

原创 推薦算法召回

文章目錄向量化召回圖嵌入雙塔模型協同過濾深度樹匹配矩陣分解熱度召回內容召回(用戶畫像)上下文 向量化召回 向量化召回,主要通過模型來學習用戶和物品的興趣向量,並通過內積來計算用戶和物品之間的相似性,從而得到最終的候選集。其中,比較

原创 遷移學習在推薦中的應用——騰訊PeterRec框架

文章目錄爲什麼用遷移學習問題與挑戰騰訊看點是怎樣做的空洞卷積神經網絡模型補丁取得的效果方法細節預訓練微調實驗結果無監督預訓練微調代碼實踐開源代碼 爲什麼用遷移學習 大量的研究根據建模的用戶-物品交互序列生成推薦,效果也不錯。但是很