2019 未來杯高校 AI 挑戰賽 > 圖像-發現超新星
1. 任務目標
設計一個目標檢測模型,從天文望遠鏡拍攝到的影像中發現疑似新星、超新星。
2. 規則說明
參賽選手需要基於給定的數據集,設計並訓練模型,用於檢測PSP項目中天文望遠鏡拍攝到的影像中的疑似星體,排除噪點和鬼影。測試集中包含志願者對座標中心點的標註,以及高級用戶對此標註的進一步分類標註。包含 疑似星體 和 非疑似星體,詳見“數據集”頁面。疑似星體包括高級用戶標註爲:已知的疑似超新星(known)、新發現的疑似超新星(newtarget)、變星或疑似變星(isnova)、恆星(isstar)、小行星(asteroid)。非疑似星體包括高級用戶標註爲:噪點(noise)、鬼影(ghost)、無可疑目標(pity)。每組包含三張照片,分別爲新圖、歷史圖,和這兩張圖片的差值圖像。
3. 測試集發放與結果提交
測試集會於約定時間開放給選手,選手需要在提交截止時間前提交正式數據集的驗證結果、模型和代碼,詳見“結果提交”頁面。每隊選手有3次提交機會,取最好成績作爲客觀成績。
- 測試集 csv 格式如下:
id
d52f52b895f03a214a3a077acd253066
0b1685708bdf8bf82f1ffce8705b109b
732c55c0629a016be567c5fe76d3cf96
06bb4bc28935b60334153e7e8a5a06fd
530099dd7961f5341f66d8cdcb89269b
9e9b6fd78b5240058f5f6db837a16d48
412375a90b92dd4c71d1245b5332c134
1bfe2a17b1827a9eea1b5f2610aa7026
f5796ac41ed58be966f253b59a83419f
...
- 結果需要提交 csv 文件,格式要求如下:
id,x1,y1,x2,y2,x3,y3,havestar
d52f52b895f03a214a3a077acd253066,123,321,55,66,222,222,1
0b1685708bdf8bf82f1ffce8705b109b,234,432,77,88,111,111,0
732c55c0629a016be567c5fe76d3cf96,123,321,55,66,222,222,1
06bb4bc28935b60334153e7e8a5a06fd,234,432,77,88,111,111,1
530099dd7961f5341f66d8cdcb89269b,123,321,55,66,222,222,0
9e9b6fd78b5240058f5f6db837a16d48,123,321,55,66,222,222,0
412375a90b92dd4c71d1245b5332c134,123,321,55,66,222,222,0
1bfe2a17b1827a9eea1b5f2610aa7026,123,321,55,66,222,222,1
f5796ac41ed58be966f253b59a83419f,123,321,55,66,222,222,1
...
其中,每組圖片一行,(x1, y1)、(x2, y2)、(x3, y3) 爲對應id所代表圖片組的三對預測座標(疑似星體的幾何中心),按置信度由高到低排序,以圖片左上角爲(0,0)計算。havestar使用0/1表示,代表這組圖片中是否存在星體的判斷,1代表存在,0代表不存在。
4. 計分方式
每組照片,選手提交的三個預測結果的座標中,任一個與實際星體所在座標歐幾里得距離在15px之內的,即爲預測成功。預測成功得1分,不成功得0分。每組照片,選手還需提交對圖片中是否存在星體的判斷(havestar),將作爲次要的輔助計分因素。本次區域賽的目的是,可以爲需要標註的圖片提供參考,以提高人工看圖的效率。所以,計分以預測座標的命中率爲主,命中率相同的,以疑似星體判斷的F1值決定排名。計分公式如下:
S爲最終得分,N表示存在疑似星體的圖片組數,ti表示是否有預測正確的座標,有爲1,沒有爲0。其中:
F1爲F1-score,即精確率和召回率的調和平均數(在0-1之間)。
5. 測試集發放與結果提交
預測試集TestA會先行開放,提供給參賽選手調試程序和驗證模型。TestA的結果可提交至競賽平臺,獲取跑分,但不計入比賽成績。正式測試集TestB會於約定時間開放給選手,選手需要在72小時內提交正式數據集的驗證結果、模型和代碼,詳見“結果提交”頁面。每隊選手有3次提交機會,取最好成績作爲客觀成績。
6. 比賽要求
- 參賽選手需要同時提交說明文檔、預測結果、訓練和預測代碼、模型(參數集),詳見“結果提交”頁面。
- 參賽選手所提交程序應可在 Linux 環境順利運行。建議(不強制)使用 Python 2.7 或 Python3.6 作爲首選編程環境,使用 Anaconda 3 搭建軟件環境。不限制第三方軟件包使用,但須獲得合法授權和軟件拷貝,以確保主辦方可以復現程序運行過程。
- 參賽選手提交的程序須滿足輸入輸出的要求,參見“結果提交”頁面。
- 參數選手的提交物需要可完整復現訓練和預測過程,主辦方不會做任何代碼修改,如無法復現的,視作無效提交。
- 參賽選手可以使用公開開源的預訓練模型,需要提供相關下載地址。
- 不得使用提供的數據集之外的數據訓練模型。
- 不得將自行手工標註的結果運用於訓練和測試。
7. 參賽網址
https://ai.futurelab.tv/contest_detail/1
8. 背景知識介紹
http://psp.china-vo.org/article/sysaquiz1intro
9. 數據分析(未經允許不得轉載)