kaggle競賽寶典公衆號建立的初衷是希望將很多經典比賽的方案寫成案例的形式,每個步驟都配有一定的闡述,講述某些操作爲什麼有效等,希望可以幫助更多的新手快速入門(太多的開源只有代碼,看代碼的時間是巨大的,復現的代價也是很大的,而且很多操作也不一定有效)。到目前爲止,kaggle競賽寶典已經有9個kaggle的到銀牌的案例,以及10+個國內競賽的案例,此處將這些案例以及對應的鏈接一起彙總在下方,方便大家快速查找學習。
Kaggle平臺
1. Web Traffic Time Series Forecasting比賽(時序問題)
2. Corporación Favorita Grocery Sales Forecasting(時序問題)
-
Corporación Favorita_賽題分析
-
Corp_數據探索分析Part2_單變量數據探索
-
Corp_數據探索分析Part3_特徵變量&標籤關係分析
-
Corp_數據探索分析Part4_特徵變量&特徵變量關係分析
-
Corp_Baseline
-
Corp_銀牌方案
3. Santander Customer Transaction Prediction(匿名,二分類)
-
Santander Customer Transaction Prediction競賽Part1_EDA
-
Santander Customer Transaction Prediction競賽Part2_LB:0.900
-
Santander Customer Transaction Prediction競賽Part3_Magic(銀牌)
-
Santander Customer Transaction Prediction競賽Part4_Top1%
-
Santander Customer Transaction Prediction競賽Part5_方案彙總
4. Microsoft Malware Prediction(二分類,時序)
-
Microsoft Malware Prediction比賽EDA_Part1
-
Microsoft Malware Prediction比賽Part2_LGBBaseline(LB:0.694)
-
Microsoft Malware Prediction比賽Part3_AvSig強特+LGB(0.701)
5. Click-Through Rate Prediction(推薦)
6. Instacart Market Basket Analysis(推薦)
-
Instacart Market Basket Analysis(Part 1):EDA&Baseline
-
Instacart Market Basket Analysis(Part 2):0.3787363
-
Instacart Market Basket Analysis(Part3_1):0.4036596(銅牌)
-
Instacart Market Basket Analysis(Part3_2):0.4036596(銅牌)
7. Titanic: Machine Learning from Disaster(二分類,入門)
8. Kaggle Two Sigma(股票預測)
-
Kaggle Two Simga 第四名方案 Part 1(Shannon提供)
-
Kaggle Two Simga 第四名方案 Part 2(Shannon提供)
-
Kaggle Two Simga 第四名方案 Part 3 NN模型(Shannon提供)
9. IEEE-CIS Fraud Detection(二分類,欺詐)
10. ASHARE(分類,剩餘的賽後補充)
國內競賽平臺
1. CMTR(KDD19,推薦,多分類)
-
ContextAware MultiModal Transportation Recommendation Part1賽題解析
-
ContextAware MultiModal Transportation Recommendation Part2 EDA
-
CAMMTR(KDD19)_Part3_多分類Baseline分享(含Code)
-
CAMMTR(KDD19)_Part4_複賽top10方案(含Code)
2. NIPS2018 AutoML比賽(匿名,多數據集)
3. JDATA19_用戶對品類下店鋪的購買預測(時序,推薦)
4. 全球城市計算AI挑戰賽(時序,迴歸)
-
全球城市計算AI挑戰賽Part1_EDA
-
天池地鐵流量預測Part2_Rule(LB_12.10,Top2%) (人畜無害小白兔提供)
-
全球城市計算AI挑戰賽Part3_(A top1, C top2方案)
5. 信貸用戶逾期預測(二分類,欺詐)
6. 天文數據挖掘大賽(多分類,天文)
7. JDD人口動態普查(時序)
8. 工程機械設備故障預測(多分類)
-
基於機器學習的工程機械設備故障預測系統Part1 - EDA 部分
-
基於機器學習的工程機械設備故障預測系統Part2 -- Top5方案
-
基於機器學習的工程機械設備故障預測系統Part3 -- 測試集leak
9. 消費者人羣畫像—信用智能評分
10. 騰訊廣告算法大賽19