DataWhale 组队学习数据挖掘实践 任务一

任务1 - 数据分析(2天)

数据集下载

这是我们本次实践数据的下载地址 

https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw

说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签:0表示未逾期,1表示逾期。

数据集涉密,不要开源到网上,谢谢~

要求:数据切分方式 - 三七分,其中测试集30%,训练集70%,随机种子设置为2018

任务1:对数据进行探索和分析。时间:2天

  • 数据类型的分析
  • 无关特征删除
  • 数据类型转换
  • 缺失值处理
  • ……以及你能想到和借鉴的数据分析处理

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章