字節跳動 - 短視頻內容理解與推薦競賽

官網:https://biendata.com/competition/icmechallenge2019/

數據集說明:https://biendata.com/competition/icmechallenge2019/data/

訓練集
文件說明/Read me:http://drive.bytedance.net/p/DfNmxDIQuLkFGP7qBQ
賽道1 - 大規模數據集,億級別的數據信息。
參考官網

賽道2 - 小規模數據集,千萬級別的數據信息。

final_track2_train.txt.tgz http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/final_track2_train.txt.tgz 407M
track2_face_attrs.txt.tgz http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/track2_face_attrs.txt.tgz 63M
track2_title.txt.tgz http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/track2_title.txt.tgz 72M
track2_video_features.txt.tgz http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/track2_video_features.txt.tgz 4.3G

測試集
賽道1 - 大規模數據集,億級別的數據信息。
參考官網

賽道2 - 小規模數據集,千萬級別的數據信息。

final_track2_test_no_anwser.txt.tgz http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/final_track2_test_no_anwser.txt.tgz 58M

測試集下載說明:
1.測試集中finish、like字段值爲-1。
2.測試集中包含少部分未曾出現在訓練集中的userid。

Baseline 方法代碼

github地址:https://github.com/challenge-ICME2019-Bytedance/Bytedance_ICME_challenge
競賽提供的baseline方法使用到以下5個特徵:user_id, user_city, item_id,author_id,item_city

  • TRACK2 LIKE TASK:
    auc: 86.5%
    #------------------------params-------------------------#
    embedding_size = 40
    optimizer = adam
    lr = 0.0005

  • TRACK FINISH TASK:
    auc: 69.8%
    #------------------------params-------------------------#
    embedding_size = 40
    optimizer = adam
    lr = 0.0001

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章