【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 論文詳解

https://arxiv.org/pdf/1906.04365.pdf

在這裏插入圖片描述

背景

以往的點擊率預估模型像FM系列、WDN等模型,都只是考慮特徵和ctr之間的聯繫,阿里的這篇論文,提出了DeepMCP模型,不僅考慮了特徵和ctr之間的聯繫,同時考慮了特徵和特徵間的關係,如用戶和廣告、廣告和廣告間的聯繫。
在這裏插入圖片描述
DeepMCP模型主要由三個部分組成:matching subnet、correlation subnet和prediction subnet。前兩個模型用來學習特徵間的聯繫,通過命名也可以很容易理解:matching subnet用來學習用戶和廣告間的聯繫(whether an ad matches a user’s interest),correlation subnet用來學習廣告間的關係(which ads are within a time window in a user’s click sequence);prediction subnet則用來學習特徵和ctr間的關係。

DeepMCP結構

DeepMCP的訓練過程和測試過程是分離的,如下圖所示,在訓練過程,模型不但要學習feature和ctr間的關係,同時還要學習matching subnet和correlationb subnet兩個網絡,三個subnet的loss加權求和纔是訓練過程的最終loss;而在測試過程,模型只需要對測試數據進行預測(user、ad間的關係模型已經在訓練過程中學習到),這樣在serving階段就會簡單很多。
在這裏插入圖片描述
以往的點擊率預估模型都是學習feature和ctr的關係,DeepMCP爲什麼要額外加上兩個子網絡呢?如下圖所示,以往的模型可以表示爲左圖,但是對於實際數據,可能存在着以下情況:user1和user對ad1都感興趣,對ad2都不感興趣,如果user1也對ad3感興趣,那麼按照協同過濾的思想,user2對ad3頁更可能感興趣;同樣,ad1和ad3可能更相似,在以往的模型中,模型足夠powerful,這種隱性關係可能會學習到,但現在如果把這種關係作爲一個特徵來影響loss,從而讓模型顯式地考慮到它,那麼模型也應該更加powerful。
在這裏插入圖片描述
於是,DeepMCP被設計成以下結構。
在這裏插入圖片描述
Note:論文代碼整理之後再更新說明~

  • 更新時間:20191010
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章