簡潔易用可擴展,一個基於深度學習的 CTR 模型包
原標題:簡潔易用可擴展,一個基於深度學習的 CTR 模型包
01 前言
在計算廣告和推薦系統中,CTR 預估一直是一個核心問題。無論在工業界還是學術界都是一個熱點研究問題,近年來也有若干相關的算法競賽。
本文介紹一個基於深度學習的 CTR 模型包 DeepCTR,具有簡潔易用、模塊化和可擴展的優點。
02 CTR預估簡介
CTR 預估是計算廣告中最核心的算法之一,那麼 CTR 預估是指什麼呢?簡單來說,CTR 預估是對每次廣告的點擊情況做出預測,預測用戶是點擊還是不點擊。
在計算廣告和推薦系統中,CTR 預估一直是一個核心問題。無論在工業界還是學術界都是一個熱點研究問題,近年來也有若干相關的算法競賽。
03 DeepCTR簡介
人們通過構造有效的組合特徵和使用複雜的模型來學習數據中的模式來提升效果。
基於因子分解機的方法,可以通過向量內積的形式學習特徵的交互,並且泛化到那些沒有出現過的組合上。
隨着深度神經網絡在若干領域的巨大發展,近年來研究者也提出了若干基於深度學習的分解模型來同時學習低階和高階的特徵交互,如:
FNN,PNN,Wide&Deep,DeepFM,NFM,AFN,DIN 等。
對於剛接觸這方面的同學來說,可能對這些方法的細節還不太瞭解,雖然網上有很多介紹,但是代碼卻沒有統一的形式,且使用起來不是很方便,從頭開始實現成本又比較高。
那麼這裏介紹一個基於深度學習的 CTR 模型包 DeepCTR,無論是使用還是學習都很方便。
DeepCTR 是一個簡潔易用、模塊化和可擴展的基於深度學習的CTR模型包。除了近年來主流模型外,還包括許多可用於輕鬆構建您自己的自定義模型的核心組件層。
您可以像使用其他 Keras 模型一樣簡單的通過 model.fit() 和 model.predict() 使用這些複雜模
型。
圖:支持文檔
04 安裝與使用
安裝
使用例子:
下面用一個簡單的例子告訴大家,如何快速的應用一個基於深度學習的CTR模型。
The Criteo Display Ads dataset 是 kaggle 上的一個 CTR 預估競賽數據集。裏面包含13個數值特徵 I1-I13 和26個類別特徵 C1-C26。
05 總結
DeepCTR 是一個簡潔易用、模塊化和可擴展的基於深度學習的 CTR 模型包。本文對DeepCTR 進行簡單介紹,並舉例說明,同時提供 DeepCTR 的代碼、文檔資源。
06 資源下載
文檔主頁:
https://deepctr-doc.readthedocs.io/en/latest/index.html
代碼主頁:
https://github.com/shenweichen/DeepCTR