【比賽記錄】2020國際大數據競賽:高傳染性傳染病的傳播趨勢預測(一)初讀數據

020國際大數據競賽:高傳染性傳染病的傳播趨勢預測(一)初讀數據

一、比賽地址:

2020第六屆百度&西安交大大數據競賽暨IKCEST第二屆“一帶一路”國際大數據競賽

二、比賽簡介:

競賽背景:

本屆大數據競賽在中國工程院、教育部高等學校大學計算機課程教學指導委員會及絲綢之路大學聯盟的指導下,由聯合國教科文組織國際工程科技知識中心(IKCEST)、中國工程科技知識中心(CKCEST)、百度公司及西安交通大學共同主辦,旨在放眼“一帶一路”倡議沿線國家,通過競賽方式挖掘全球大數據人工智能尖端人才,實現政府—產業—高校合力推動大數據產業研究、應用、發展的目標,進一步夯實賽事的理論基礎與實踐基礎,加快拔尖AI創新人才培養。

傳染病(Contagious Diseases)的有效防治是全人類面臨的共同挑戰,如何通過大數據,特別是數據的時空關聯特性,來精準預測傳染病的傳播趨勢和速度,將極大有助於人類社會控制傳染病,保障社會公共衛生安全。希望藉助此次競賽,充分發揮全球選手的聰明才智,運用大數據技術助力傳染病的傳播預測和控制,增強人類社會合作抗風險的意識和能力。

任務描述:

針對賽題所構造的若干虛擬城市,構造傳染病羣體傳播預測模型,根據該地區傳染病的歷史每日新增感染人數、城市間遷徙指數、網格人流量指數、網格聯繫強度和天氣等數據,預測羣體未來一段時間每日新增感染人數。

賽題共涉及11個虛擬城市90天的感染情況,每個城市有若干重點區域。初賽要求針對所提供的5個城市,利用每個城市各區域前45天的樣本數據進行訓練,預測每個城市各區域後30天每天的新增感染人數。複賽要求針對包含初賽城市在內的11個城市,利用每個城市各區域前60天的樣本數據進行訓練,預測每個城市各區域後30天每天的新增感染人數。

數據集:

訓練集共包括5個城市,每個城市目錄下的數據集總體說明:

  1. 各區域每天新增感染人數。文件名:infection.csv。提供前45天每天數據,文件格式爲城市ID,區域ID,日期,新增感染人數;
    在這裏插入圖片描述
    在這裏插入圖片描述
  1. 城市間遷徙指數。文件名:migration.csv。提供45天每天數據。文件格式爲遷徙日期,遷徙出發城市,遷徙到達城市,遷徙指數;
    在這裏插入圖片描述在這裏插入圖片描述
  1. 網格人流量指數。文件名:density.csv。提供45天內每週兩天抽樣數據,文件格式爲日期,小時,網格中心點經度,網格中心點緯度,人流量指數;
    在這裏插入圖片描述在這裏插入圖片描述
  1. 網格關聯強度。文件名:transfer.csv。城市內網格間關聯強度數據,文件格式爲小時,出發網格中心點經度,出發網格中心點緯度,到達網格中心點經度,到達網格中心點緯度,遷移強度;
    在這裏插入圖片描述在這裏插入圖片描述
  1. 網格歸屬區域。文件名:grid_attr.csv。城市內網格對應的歸屬區域ID,文件格式爲網格中心點經度,網格中心點緯度,歸屬區域ID;
    在這裏插入圖片描述在這裏插入圖片描述
  1. 天氣數據。文件名:weather.csv。提供45天每天數據,文件格式爲日期,小時,氣溫,溼度,風向,風速,風力,天氣;
    在這裏插入圖片描述在這裏插入圖片描述
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章