原创 [CTR預估] Recommending What Video to Watch Next

1.介紹 本文講解的是youtube發表在Recsys 2019的文章 “Recommending What Video to Watch Next: A Multitask Ranking System” 文章是關於推薦系排序模

原创 【CTR預估】 xDeepFM模型

xDeepFM 模型看作者郵箱應該中科大、北郵、微軟合作發表的,發表在kdd2018 。 看這個模型的原因是因爲最近在寫Deep Cross Network的時候感覺總是怪怪的,因爲DCN對同一個特徵的embedding內部都做了

原创 【GCN】: IntentGC算法框架

本篇論文是阿里發表在kdd2019的文章,是gcn在淘寶場景下的實際應用,還提供了源碼,很具有可讀性。 論文地址:https://arxiv.org/pdf/1907.12377.pdf 作者在論文裏面附有對應的代碼地址:https://

原创 【基於序列的推薦】:Session-based Recommendations with Recurrent Neural Networks (附開源代碼)

論文下載地址:https://arxiv.org/pdf/1511.06939.pdf 論文實現代碼:https://github.com/Shicoder/GRU4Rec 首先解釋一下什麼是Session,Session就是從用戶進入推

原创 【Transformer模型】:Attention is all your need(附attention的代碼)

tranformer已經火了好長一段時間了,一直只是只聞其名不知其意,特地看了attention is all your need。     這篇論文摒棄了傳統encoder-decoder模型必須結合cnn或者rnn的固有模式,只用了a

原创 【日本雅虎新聞推薦】:Embedding-based News Recommendation for Millions of Users(附開源代碼)

本篇論文由日本雅虎團隊發表於KDD 2017,利用深度學習方法將用戶和文章進行embedding化,再進行推薦。 下載地址:http://dacemirror.sci-hub.tw/proceedings-article/b79bf692

原创 樸素貝葉斯算法推導分析

Author: DivinerShi 朴樹貝葉斯方法其實就是一個根據先驗求後驗的過程。 **優點:**思想簡單,實現方便,適合小規模數據,適合多分類問題; **缺點:**需要基於一定的假設,假設各個特徵之間相互獨立;對輸入數據的表

原创 K近鄰算法(KNN)推導分析

Knn和kd樹介紹 author:DivinerShi KNN算法 優點: 直觀,簡單,可以用來做分類也可以用來做迴歸 可用於非線性分類,訓練時間複雜度爲O(n) 準確度高,對數據沒有假設,對outier不敏感。 缺點: 計算量大

原创 支持向量機(SVM)算法推導

Author: DivinerShi 線性迴歸可以簡單理解爲去找到一條線,使得這條線可以區分不同類的數據。那麼SVM就是去找到所有可行的線中,最優的那條。什麼叫最優?就是距離兩類數據都最遠的那條分割線。 優點: 可用於線性和非線性

原创 【Graph Embedding】: metapath2vec算法

metapath2vec: Scalable Representation Learning for Heterogeneous Networks 發表在kdd2017,用於解決異構網絡的embedding表示。個人看完文章的感覺就是將d

原创 Xgboost算法推導及分析

Author: DivinerShi Xgboost其實就是gbdt的一個改進版本,但是因爲效果好,工程建設完善,所以經常和傳統的gbdt分開講。 Boost思想的話是每一步產生一個弱預測模型(如決策樹),並加權累加到總模型中,經

原创 【Graph Embedding】: DeepWalk算法

論文“DeepWalk: Online Learning of Social Representations” 發表在kdd2014, 下載地址:https://arxiv.org/pdf/1403.6652.pdf 作者開源的代碼:ht

原创 【Semantic Embedding】: LSTM-DSSM模型

論文下載地址:https://arxiv.org/pdf/1412.6629.pdf 其實這幾篇論文,DSSM, C-DSSM, LSTM-DSSM 百度一下資料一大堆,不過我還是選擇自己去看了一遍,然後做一下筆記,便於更深入的理解。不過

原创 EM算法推導分析

研一整理的紙質資料,整理一下。 EM算法推導:

原创 【CTR預估】The Wide and Deep Learning Model(譯文+Tensorlfow源碼解析)

本文主要講解Google的Wide and Deep Learning 模型。本文先從原始論文開始,先一步步分析論文,把論文看懂。再去分析官方開源的Tensorflow源碼,解析各個特徵的具體實現方法,以及模型的具體構造方法等。