FM與DNN的組合——FNN模型

origin paper: https://arxiv.org/pdf/1601.02376.pdf

解決痛點

特徵學習和模型泛化的能力有限。

網絡結構

top-down視角

CTR層

$\hat{y}=\operatorname{sigmoid}\left(\boldsymbol{W}_{3} \boldsymbol{l}_{2}+b_{3}\right)$ $\boldsymbol{W}_{3} \in \mathbb{R}^{1 \times L}，b_{3} \in \mathbb{R} \text { and } l_{2} \in \mathbb{R}^{L}$ $\operatorname{sigmoid}(x)=1 /\left(1+e^{-x}\right)$

$l_2$ 層

$l_{2}=\tanh \left(\boldsymbol{W}_{2} \boldsymbol{l}_{1}+\boldsymbol{b}_{2}\right)$ $\boldsymbol{W}_{2} \in \mathbb{R}^{L \times M}, \boldsymbol{b}_{2} \in \mathbb{R}^{L} \text { and } \boldsymbol{l}_{1} \in \mathbb{R}^{M}$ $\tanh (x)=\left(1-e^{-2 x}\right) /\left(1+e^{-2 x}\right)$

$l_1$ 層

$\boldsymbol{l}_{1}=\tanh \left(\boldsymbol{W}_{1} \boldsymbol{z}+\boldsymbol{b}_{1}\right)$ $\boldsymbol{W}_{1} \in \mathbb{R}^{M \times J}, \boldsymbol{b}_{1} \in \mathbb{R}^{M} \text { and } \boldsymbol{z} \in \mathbb{R}^{J}$ $\boldsymbol{z}=\left(w_{0}, \boldsymbol{z}_{1}, \boldsymbol{z}_{2}, \ldots \boldsymbol{z}_{i}, \ldots, \boldsymbol{z}_{n}\right)$

$z$ 的生成

$z_{i}$ 表示每個特徵的向量，由： $\boldsymbol{z}_{i}=\boldsymbol{W}_{0}^{i} \cdot \boldsymbol{x}\left[\text { start }_{i}: \mathrm{end}_{i}\right]=\left(w_{i}, v_{i}^{1}, v_{i}^{2}, \ldots, v_{i}^{K}\right)$ 得到。
其中 $\boldsymbol{W}_{0}^{i} \in \mathbb{R}^{(K+1) \times\left(\mathrm{end}_{i}-\operatorname{start}_{i}+1\right)}$

這裏 $x$ 表示輸入的所特徵組合得到的一維向量， $\boldsymbol{x}\left[\text { start }_{i}: \mathrm{end}_{i}\right]$ 表示，第 i個filed的特徵， $W_{0}^{i}$ 表示第 $i$ 個filed的embedding矩陣，將特徵轉化爲對應的dense向量。在生成 $W$ 矩陣時， $w_{i}$ 爲常數項， $v_{i}^{1}..v_{i}^{K}$ 由FM模型學習得到。

$W_{0}^{i}$ embedding矩陣的初始化生成

該部分即爲FM模型，目標函數爲：
$y_{\mathrm{FM}}(\boldsymbol{x}):=\operatorname{sigmoid}\left(w_{0}+\sum_{i=1}^{N} w_{i} x_{i}+\sum_{i=1}^{N} \sum_{j=i+1}^{N}\left\langle\boldsymbol{v}_{i}, \boldsymbol{v}_{j}\right\rangle x_{i} x_{j}\right)$
損失函數爲：
$L(y, \hat{y})=-y \log \hat{y}-(1-y) \log (1-\hat{y})$
學到的 $v$ 組合起來就是 $W$

總結

from down-top視角

首先在最底層學到每次filed的embedding矩陣
將所有特徵進行embedding並組合層 $z$
經過 $l_{1},l_2$ 兩層變換
最終將將結果用sigmoid轉化爲概率
FM生成僅作爲初始化W使用

FNN的亮點在於將FM的結果矩陣的初始化向量，上層是個DNN，創新點在模型融合上。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

FM與DNN的組合——FNN模型

解決痛點

網絡結構

CTR層

$l_2$ 層

$l_1$ 層

$z$ 的生成

$W_{0}^{i}$ embedding矩陣的初始化生成

總結

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

go語言 defer延遲機制

pandas對不同類型的column進行fillna

Keras 搭建神經網絡的簡單pipeline

將conda環境導入Jupyter

ImportError: cannot import name create_prompt_application

Jupyter設置代理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

FM與DNN的組合——FNN模型

解決痛點

網絡結構

CTR層

l2l_2l2​層

l1l_1l1​層

zzz的生成

W0iW_{0}^{i}W0i​embedding矩陣的初始化生成

總結

$l_2$ 層

$l_1$ 層

$z$ 的生成

$W_{0}^{i}$ embedding矩陣的初始化生成