这是一个菜鸟的数据挖掘实战记录,目的是快速门数据挖掘,少走弯路。
内容上,由于自己的确是菜得不行,所以在跟随入门级比赛:二手车价格预测进行实战中,会重点叙述学习方法和思路,并补充其他学习资料。内容预计分为六篇正文,本篇是前言,介绍基础知识和学习框架。
学习方法是有共性的,希望我的学习过程可以帮到其他对数据挖掘感兴趣的小伙伴。
1. 学习路径
数据挖掘入手的一个好方法是实战,通过实践可以快速把握整体情况和自己的薄弱环节。本次就是通过Datawhale和天池合办的一个零基础数据挖掘比赛进行学习。
- 学习资料
- 学习路径思维导图
来源:DataWhale官方
思维导图清晰地描述了整个学习路径,之后我们将按照如图框架进行学习。
2. 学习方法
考虑到自身基础薄弱的现状,倾向于剥洋葱式学习法,层层深入,主抓重点。
- 第一层:确定学习目标,了解基础数据挖掘步骤
- 第二层:通过代码和资料学习,了解每一步处理的重点和目的
- 第三层:对重难点加深学习
- 同时,记得运用我们的2W1H学习好伴侣:WHAT做什么,WHY为什么这么做、HOW怎么做
入门阶段着重解决前两层,第三层将在确定重难点后进行。
其他
比赛相关学习资料将在天池分享,也可关注Datawhale公众号查看详情