DataWhale 組隊學習數據挖掘實踐 任務一

任務1 - 數據分析(2天)

數據集下載

這是我們本次實踐數據的下載地址 

https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw

說明:這份數據集是金融數據(非原始數據,已經處理過了),我們要做的是預測貸款用戶是否會逾期。表格中 "status" 是結果標籤:0表示未逾期,1表示逾期。

數據集涉密,不要開源到網上,謝謝~

要求:數據切分方式 - 三七分,其中測試集30%,訓練集70%,隨機種子設置爲2018

任務1:對數據進行探索和分析。時間:2天

  • 數據類型的分析
  • 無關特徵刪除
  • 數據類型轉換
  • 缺失值處理
  • ……以及你能想到和借鑑的數據分析處理

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章