2020華爲大數據參賽總結

總結一下這次參加華爲大數據比賽的體會和收穫
此次比賽最後止步200+ 沒能進複賽
第一次參加大數據競賽 雖然沒能進複賽 但總得來說 還是很值得的
初賽一個月的備賽時間 我和我的組員大約只用了半個月在比賽上
首先 比賽真的是可以長見識的 這次大數據的訓練集有20GB
剛拿到數據的那一週都不知道怎麼下手 最後是通過將大文件分割成若干個小文件 找到了比賽入口
通過這次比賽 我粗略地學習了python 機器學習 數據挖掘
人生苦短 我用python
python的庫很豐富
這次在csv文件的操作上 大量的使用了pandas
在比賽的最後一天 終於跑通了geopandas 繪製出了測試集的航線軌跡 害要是早點完成 指不定…就苟進複賽了…
數據挖掘80%的時間都用在數據清洗上 這是這次比賽最深刻的體會
合理的利用可視化工具 可以省事省力解決問題 下次參賽的話 可以早點從這個角度考慮
同時心態的調整也很重要 多溝通多交流 緊跟大佬的步伐
有機會的話 還會繼續參加這類比賽的 很值得

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章