在線廣告的exploration/exploitation trade-off(勘探和開採問題)

剛剛在看ICML 2010的一篇關於搜索廣告CTR預估的文章:

Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft’s Bing Search Engine

上週跟中科院的同學喫飯時,他們說在KDDCUP競賽時,這篇文章的算法效果非常好。當時就想好好讀一下,拖了幾天,今天終於看了個開頭。


Bing adCenter內部舉辦了一個CTR預估的比賽,這篇論文的方法adPredictor表現最優異,加上方法可以並行化,而且是online learning,優點多多,後來逐漸替換了Bing原來的算法。可見這個方法的威力。

文章在介紹算法細節之前,先普及了一些搜索廣告、關鍵詞競價、常用特徵、效果評估方法等信息。其中有一點很有意思:

CTR預估方法會影響到各個廣告位上的內容,進而影響到算法未來的訓練數據,因此不得不面對一個“勘探”和“開採”的問題。換句話說,如果系統不能給新廣告足夠的展示機會,算法很容易陷入局部最優解,廣告的候選池會越來越小。


CTR預估如此,推薦系統也面臨同樣的問題。所以豆瓣電臺也添加了一個策略,在已挖掘的用戶喜好之外,按一定的比例加一些用戶沒聽過的歌曲,擴展用戶的興趣範圍,避免“過度開採”。


這裏還有關於計算廣告的一點資料:

Estimating the Click-Through Rate for New Ads

Introduction to Computational Advertising

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章