任務1 - 數據分析(2天)
數據集下載
這是我們本次實踐數據的下載地址
https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw
說明:這份數據集是金融數據(非原始數據,已經處理過了),我們要做的是預測貸款用戶是否會逾期。表格中 "status" 是結果標籤:0表示未逾期,1表示逾期。
數據集涉密,不要開源到網上,謝謝~
要求:數據切分方式 - 三七分,其中測試集30%,訓練集70%,隨機種子設置爲2018
任務1:對數據進行探索和分析。時間:2天
- 數據類型的分析
- 無關特徵刪除
- 數據類型轉換
- 缺失值處理
- ……以及你能想到和借鑑的數據分析處理