Youtube時長預估

原創

jony0917

2020-07-05 02:15

Watch Time推導

論文中排序模型的訓練目標爲視頻點擊率，記爲：

$p = P(y=1|x)=\frac{1}{1+e^{-\theta^Tx}}$

模型上線後的預測值計算方法卻是：

$predict = e^{\theta^Tx}$

其中 $\theta$ 表示模型的參數， $x$ 表示模型的特徵（ $\theta,x$ 實際是模型最後一層隱層參數和輸入，當模型只有一層隱層時候，則是模型的全部參數和樣本特徵）。

簡單解釋一下預測值採用這種計算方式的原因。

首先Logit迴歸，是對樣本正負概率比值 $Odd$ 的對數值用線性迴歸模型建模：

$log\frac{p}{1-p}=\theta^Tx$

得出

$predict=e^{\theta^Tx}=\frac{p}{1-p}$

可見Youtubed模型的在預測階段輸出的值實際上是正負概率比值，也就是所謂的Odd值。

目前爲止可得出第一個結論，排序模型預測值爲Odd：

$predict=Odd \space\space\space\space\space\space\space\space(1)$

第二，YouTube訓練過程採用了播放時長做加權，也就是所謂的Weighted Logistic，模型訓練的損失函數爲：

$Loss=-Time*label*logp - (1-label)log(1-p)$

這種方式，相當於將當前正樣本複製了Time次。

我們以具體的一個樣本爲例，例如樣本特徵爲 $x=X$ ，其中 $X$ 表示某個具有具體取值的向量，我們將此類樣本的總體記爲 $I=\{(y, x) | x=X\}$ , 正例總體記爲 $I_{positive}=\{(y, x) |y=1, x=X\}$ , 負例的總體 $I_{negative}=\{(y, x) |y=0, x=X\}$ 。

將訓練樣本中出現的此類樣本的集合，也就是採樣集合，記爲 $S=\{(y, x)| x = X\}$ 。正樣本採樣集合記爲 $S_{positive}=\{(y, x)|y=1,x=X\}$ ，集合的大小記爲 $m=|S_{positive}|$ , 負樣本採樣集合記爲 $S_{negative}=\{(y,x)|y=0,x=X\}$ ,結合的大小記爲 $n=|S_{negative}|$ 。

類似地，將正樣本複製Time次後此類樣本的採樣集合記爲 $S'=\{(y,x)|x=X\}$ ，正樣本採樣集合記爲 $S'_{positive}=\{(y,x)|y=1,x=X\}$ ，負樣本集合記爲 $S'_{negative}=\{(y,x)|y=10,x=X\}$

將複製後採樣集合對用的總體集合記爲 $I'=\{(y,x)|x=X\}$ ，正樣本總體記爲 $I'_{positive}=\{(y,x)|y=1, x=X\}$ ，負樣本總體記爲 $I'_{negative}=\{(y,x)|y=0,x=X\}$ 。

假設訓練數據採樣比較充分，也就是滿足$S\sim I, \space S’\sim I’。 $則有以下推導：

$Odd_I=\frac{|I_{positive}|}{|I_{negative}|}\approx Odd_S=\frac{|S_{positive}|}{|S_{negative}|}=\frac{m}{n}$

$Odd_{I'}=\frac{I'_{positive}}{I'_{negative}}\approx Odd_{S'}\frac{|S'_{positive}|}{|S'_{negative}|}=\frac{Time * |S_{positive}|}{|S_{negative}|}=Time\frac{m}{n}=Time\frac{m}{m+n-m}=Time\frac{\alpha}{1-\alpha},\alpha=\frac{m}{m+n}$

$\alpha=\frac{m}{m+n}=P(y=1|x\in S)\approx P(y=1|x\in I)=p$

目前爲止，結合結論(1)可得出第二結論，Time Weighted Logitic模型預測目標爲：

$predict=Odd_{I'}=Time\frac{p}{1-p},p=P(y=1|x\in I)\space\space\space\space(2)$

第三，繼續推導，有泰勒展開式：

$Time\frac{p}{1-p}=Time * p *(1+p+p^2+p^3+...)=Time*(p + p^2 + ...)\approx Time*p, p\in (0,1)$

可以得出最後的結論：

$predict\approx Time*p=Time*P(y=1|x\in I)=E[Time; x\in I]\space\space\space\space(3)$

其中 $p=P(y=1|x\in I)$ , 也就是說預測值爲總體集合 $I$ 上的播放時長的期望。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Youtube時長預估

Watch Time推導

自學編程兩個月，現在我月入 4 萬元

百度安全多篇議題入選Blackhat Asia以硬技術發現“芯”問題

「實戰應用」如何用圖表控件LightningChart創建2D氣泡圖

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

Youtube時長預估

推薦系統實踐筆記（三）

推薦系統技術內幕（四）：算法篇之召回與融合

推薦系統實踐筆記（二）：利用與探索問題

推薦算法普查（基於深度學習）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結