【轉】數據挖掘進階:kaggle競賽top代碼分享

原文:https://zhuanlan.zhihu.com/p/26309073

Click-Through Rate Prediction

很經典的點擊率預估問題,這個比賽很值得大家好好研究,冠軍主要使用LibFFM方法,除了該方法之外還可以學的點擊率預估中很實用的FTRL(google發表的論文)方法。

  • 第一名: LibFFM
  • FTRL: Beat the benchmark with less than 1MB of memory.

Rossmann Store Sales

銷量預測問題,這個比賽中第三名的方法很值得參考,選手結合了entity-embedding和神經網絡,後續在JDATA京東算法大賽中會嘗試實用該方法。

State Farm Distracted Driver Detection

疲勞駕駛檢測,該比賽是我入門深度學習的比賽,選手們分享了很多有趣的方法,包括基本的深度學習模型訓練,如何應用模型遷移、數據加強、模型微調等技巧

Outbrain Click Prediction

預測哪塊內容用戶會點擊,點擊率預測問題,值得參考

更新:

Facebook V: Predicting Check Ins

評論區出現大神, @李力 第五名大神,大家可以評論區找他~

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章