官網:https://biendata.com/competition/icmechallenge2019/
數據集說明:https://biendata.com/competition/icmechallenge2019/data/
訓練集
文件說明/Read me:http://drive.bytedance.net/p/DfNmxDIQuLkFGP7qBQ
賽道1 - 大規模數據集,億級別的數據信息。
參考官網
賽道2 - 小規模數據集,千萬級別的數據信息。
final_track2_train.txt.tgz | http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/final_track2_train.txt.tgz | 407M |
---|---|---|
track2_face_attrs.txt.tgz | http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/track2_face_attrs.txt.tgz | 63M |
track2_title.txt.tgz | http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/track2_title.txt.tgz | 72M |
track2_video_features.txt.tgz | http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/track2_video_features.txt.tgz | 4.3G |
測試集
賽道1 - 大規模數據集,億級別的數據信息。
參考官網
賽道2 - 小規模數據集,千萬級別的數據信息。
final_track2_test_no_anwser.txt.tgz | http://lf1-ttcdn-tos.pstatp.com/obj/icme2019&bytedance_challenge_dataset/final_track2_test_no_anwser.txt.tgz | 58M |
---|
測試集下載說明:
1.測試集中finish、like字段值爲-1。
2.測試集中包含少部分未曾出現在訓練集中的userid。
Baseline 方法代碼
github地址:https://github.com/challenge-ICME2019-Bytedance/Bytedance_ICME_challenge
競賽提供的baseline方法使用到以下5個特徵:user_id, user_city, item_id,author_id,item_city
-
TRACK2 LIKE TASK:
auc: 86.5%
#------------------------params-------------------------#
embedding_size = 40
optimizer = adam
lr = 0.0005 -
TRACK FINISH TASK:
auc: 69.8%
#------------------------params-------------------------#
embedding_size = 40
optimizer = adam
lr = 0.0001