【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

原創

2020-07-07 01:30

https://arxiv.org/pdf/1906.04365.pdf

背景

以往的點擊率預估模型像FM系列、WDN等模型，都只是考慮特徵和ctr之間的聯繫，阿里的這篇論文，提出了DeepMCP模型，不僅考慮了特徵和ctr之間的聯繫，同時考慮了特徵和特徵間的關係，如用戶和廣告、廣告和廣告間的聯繫。

DeepMCP模型主要由三個部分組成：matching subnet、correlation subnet和prediction subnet。前兩個模型用來學習特徵間的聯繫，通過命名也可以很容易理解：matching subnet用來學習用戶和廣告間的聯繫（whether an ad matches a user’s interest），correlation subnet用來學習廣告間的關係（which ads are within a time window in a user’s click sequence）；prediction subnet則用來學習特徵和ctr間的關係。

DeepMCP結構

DeepMCP的訓練過程和測試過程是分離的，如下圖所示，在訓練過程，模型不但要學習feature和ctr間的關係，同時還要學習matching subnet和correlationb subnet兩個網絡，三個subnet的loss加權求和纔是訓練過程的最終loss；而在測試過程，模型只需要對測試數據進行預測（user、ad間的關係模型已經在訓練過程中學習到），這樣在serving階段就會簡單很多。

以往的點擊率預估模型都是學習feature和ctr的關係，DeepMCP爲什麼要額外加上兩個子網絡呢？如下圖所示，以往的模型可以表示爲左圖，但是對於實際數據，可能存在着以下情況：user1和user對ad1都感興趣，對ad2都不感興趣，如果user1也對ad3感興趣，那麼按照協同過濾的思想，user2對ad3頁更可能感興趣；同樣，ad1和ad3可能更相似，在以往的模型中，模型足夠powerful，這種隱性關係可能會學習到，但現在如果把這種關係作爲一個特徵來影響loss，從而讓模型顯式地考慮到它，那麼模型也應該更加powerful。

於是，DeepMCP被設計成以下結構。

Note：論文代碼整理之後再更新說明~

更新時間：20191010

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

背景

DeepMCP結構

這個網絡爬蟲代碼，拿到數據之後如何存到csv文件中去？

BGE M3-Embedding 模型介紹

即刻放大鏡。跟隨鼠標，屏幕任意位置放大

【面試準備】【SQL】數據庫有哪些約束？

.NET開源強大、易於使用的緩存框架 - FusionCache

面試，有時候是個運氣活

【Redis學習筆記一】Redis特點、基礎命令和數據結構

博客目錄——Spark學習筆記

博客目錄——TensorFlow學習筆記

【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

Scala Spark報錯 task not serializable的解決辦法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結