2020中國高校計算機大賽·華爲雲大數據挑戰賽--熱身賽 Rank7 思路及代碼分享

隊名:無能萬金油


2020中國高校計算機大賽·華爲雲大數據挑戰賽–熱身賽

在這裏插入圖片描述

熱身賽:Rank 7

CSDN博客:我的博客
數據相關知識和分析參考:[上分指南] 2020華爲雲大數據挑戰賽熱身賽如何“未卜先知”
Github代碼:2020華爲雲熱身賽
(建議直接下載熱身賽code.ipynb,裏面有詳細代碼分析說明)

2020中國高校計算機大賽·華爲雲大數據挑戰賽-正式賽現在已經開始了!

報名人數已達到4133! 賽題非常有趣,華爲還爲參賽的小夥伴準備了代金卷,沒有資源的小夥伴也可以參加哦!
熱身賽和初賽的獎品也非常豐厚!!!
本Blog也會持續跟進比賽的最新消息和思路分享,感謝大家關注!

初賽(6月2日 – 6月30日)
複賽(7月13日-8月10日)
決賽(8月下旬

比賽地址:華爲雲大數據挑戰賽

賽題說明

熱身賽題——交通流量預測
隨着電子信息和移動通信技術高速發展和不斷融合,人工智能在各個領域都相繼取得了巨大的突破,城市智能體也應運而生,而城市交通又是城市智能體的核心。交通流量數據既是城市交通中的基礎數據,又是反應交通狀況的重要指標之一,準確預測交通流量對城市交通具有重大意義。本題以交通流量預測爲目標,邀請各個隊伍以歷史交通流量數據建立對應的算法模型,預測目標流量數據,通過預測值和真實值之間的對比得到預測準確率,以此來評估各隊伍所提交的預測算法。

數據處理即預測

通過基本清洗,構建合理的數據集,分數是可以達到68、69 的成績的,但是想進一步突破卻比較難, 畢竟數據有限,我們能得到的信息很少。
但是我們發現,只要訓練數據構建的好,分數就會有明顯的提升,那麼怎麼纔算好呢,其實就是越靠近,線上數據作爲訓練數據,效果就越好,因爲迴歸模型的本質其實就是擬合數據。
那這樣我們是不是可以人爲構造線上數據,而不 是用模型預測(因爲模型會有誤差)。
通過實驗是肯定的,後期我們還做了平滑的操作(自平滑),直接線上達到了76+
我們這裏還得到了,另外一個賽題的數據,也是流量相關的,但是他們的題目是預測交通指數,些許不一樣.可以作爲分析數據的參考。
這裏簡單畫了下圖:(詳細參考Github代碼)
在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章