原创 個性化推薦系統--邏輯迴歸模型的背景介紹(8-1)

一、LR(邏輯迴歸)背景知識介紹 將會介紹什麼是點擊率預估、什麼是分類模型以及LR模型的基本使用流程、LR模型的基本訓練流程,從這幾個方面介紹LR的背景知識。 1. 點擊率預估與分類模型 什麼是點擊率預估呢? 相信點擊率的概念大家都知道,

原创 個性化推薦系統--邏輯迴歸模型的數學原理(8-2)

一、單位階躍函數(sigmoid) 階躍函數及其導數: 函數表達式: 當 x = 1 時,f(x) = 0.5 ; 當  x = 10 時,f(x) 接近於1 ,這也就是之前說過的,當x > 0 的時候,會非常快速的接近於1 ;當x <

原创 個性化推薦系統--樣本選擇與特徵選擇相關知識(8-3)

回憶一下,8-1中給出的實例,當時用了3個樣本,3個特徵來演示LR模型的工作原理。但是,可能會有疑問,爲什麼只有3個樣本?在實際的項目中,可能會有非常多的樣本,其中有些樣本是可以用的,有些樣本是不可以用的,到底哪些可以用,哪些不可以用。包

原创 個性化推薦系統--個性化召回算法總結與評估方法的介紹(6-1)

一、個性化召回算法的總結 這裏會將之前介紹過的幾種算法進行歸類,並簡短介紹每一種個性化召回算法的核心原理;同時演示工業界中多種召回算法共存的架構。 下面看一下之前講過的個性化召回算法的分類: 1. 基於鄰域的:CF、LFM、基於圖的推薦p

原创 個性化推薦系統--學習排序綜述(7-1)

一、什麼是學習排序? 說起學習排序,首先介紹一下排序,排序是在搜索場景以及推薦場景中應用的最爲廣泛的。 傳統的排序方法是基於構造相關度函數,使相關度函數對於每一個文檔進行打分,得分較高的文檔,排的位置就靠前。但是,隨着相關度函數中特徵的增

原创 個性化推薦系統 5-1 content-based算法知識介紹

一、個性化召回算法Content based背景介紹 1. 思路簡單,可解釋性強 任何一個推薦系統的初衷,都是推薦出用戶喜歡的item。 基於內容的推薦,恰恰是根據用戶的喜好之後,給予用戶喜歡的物品。 eg:某一個用戶經常點擊體育類的新聞

原创 4-3 item2vec依賴模型word2vec之skip gram數學原理介紹

1. 問題抽象 skip gram是已知中間詞,最大化它相鄰詞的概率。 與CBOW的不同:CBOW的時候,是選取一次負採樣;而這裏對於中間詞的上下文的每一個詞,每一次都需要進行一個負採樣。 下面看一下條件概率: 與之前的CBOW大體形

原创 4-1 item2vec算法的背景與物理意義

item2vec的原型:word2vec 一、背景 1. Item2item的推薦方式效果顯著: 很多場景下item2item的推薦方式要優於user2item; item2item的推薦方式:在獲取item相似度矩陣之後,根據用戶的最近

原创 4-2 item2vec依賴模型word2vec之CBOW數學原理介紹

word2vec有兩種形式: CBOW skip gram 一、CBOW 網絡分爲三層:輸入層、投影層、輸出層。 輸入層:上下文; 投影層:將上下文向量加起來; 輸出層:當前詞; 投影層與輸出層之間是全連接,如果輸出的這個詞是這裏的W(

原创 3-2 personal rank 算法的數學公式推導

personal rank是可以通過用戶行爲劃分二分圖爲固定user得到item重要程度排序的一種算法。 1.算法的文字闡述 對用戶A進行個性化推薦,從用戶A節點開始在用戶-物品二分圖random walk,以alpha的概率從A的出邊中

原创 LFM 與 CF的比較

對於用戶比較多的系統,用item CF比user CF更加具有可行性。 1.理論基礎 LFM是比較傳統的監督學習的打法,根據訓練樣本的label設定損失函數,利用最優化的方法使損失函數最小化。只不過這裏的特徵是隱特徵,不像其他模型中的特徵

原创 3-1 personal rank 算法的背景與物理意義

基於圖的推薦--personal rank  1.背景 首先介紹基於圖的個性化召回算法--personal rank的背景。 (1)用戶行爲很容易表示爲圖 圖這種數據結構有兩個基本的概念--頂點和邊。 在實際的個性化推薦系統中,無論是信息

原创 2-2 LFM算法的理論基礎與公式推導

本小節主要從數學上重點介紹LFM,主要從建模方法、迭代、收斂等方面認識LFM算法。 1.LFM理論知識 (1)LFM建模公式: p(u,i)表示user-item對,如果user點擊了item,那麼p(u,i)=1,否則p(u,i)=0

原创 LFM算法綜述 (2-1)

LFM--隱語義模型,屬於協同領域。 1. LFM算法的背景 提到協同領域,很多人首先想到的就是item CF與user CF,那麼這裏說到的LFM與這兩者又有什麼區別呢? 首先簡單回憶一下item CF與user CF。 item CF

原创 個性化推薦算法綜述

什麼是推薦算法? 在介紹推薦算法之前需要先介紹一下什麼是信息過載。 信息過載就是信息的數量遠超於人手工可以遍歷的數量。比如,當你沒有目的性的去逛超市,你不可能把所有的商品都看一遍都有什麼。同樣,無論是去書店看書,還是在電影網站上搜索電影,