論文題目: DeepFM: a factorization-machine based neural network for CTR prediction
論文地址: https://www.ijcai.org/proceedings/2017/0239.pdf
論文發表於: IJCAI 2017(CCF A類會議)
論文大體內容:
本文主要介紹了一種融合FM和DNN的模型——DeepFM模型,該模型主要思想就是把WDL模型的Wide層改爲FM,並且共用特徵embedding,不但能夠學習一階特徵,還行自動的進行二階特徵組合,避免人工做特徵工程,並且DeepFM的效果也比其他常見模型的效果好;
1. DeepFM主要貢獻點:
①DNN+FM,不需要額外進行特徵組合;
②通過共享輸入數據和embedding的向量,使得模型能夠既學習低維,也學習高維特徵,而且訓練還比較高效;
③在CTR任務上取得很好的效果;
2. DeepFM的整體網絡結構如下圖所示,包括FM部分和DNN部分,最後預測結果y=sigmoid(y_fm + y_dnn);
3. DeepFM的FM部分如下圖;
4. DeepFM的DNN部分如下圖;
5. 與常見的FNN、PNN、WDL模型對比如下;
實驗
6. Dataset
7. Baseline
①LR;
②FM;
③FNN;
④PNN(3個變種);
⑤WDL(2個變種:LR+DNN,FM+DNN,都不共享低維和高維特徵);
8. 評測方法
①AUC;
②Logloss;
9. 實驗結果
10. 通過參數調整的實驗,可以發現使用3個隱層、每個隱層維度一樣、relu激活函數能取得更好的效果;
參考資料:
[1] https://blog.csdn.net/John159151/article/details/90751878
以上均爲個人見解,因本人水平有限,如發現有所錯漏,敬請指出,謝謝!