目標檢測常用數據集介紹

以下介紹來自於github工程整理:DeepLearning-500-questions,具體gihub項目在文末參考。

PASCAL VOC數據集

VOC數據集深入介紹在文末參考,垃圾CSDN,有鏈接就不讓發。。。

VOC數據集是目標檢測經常用的一個數據集,自2005年起每年舉辦一次比賽,最開始只有4類,到2007年擴充爲20個類,共有兩個常用的版本:2007和2012。學術界常用5k的train/val 2007和16k的train/val 2012作爲訓練集,test 2007作爲測試集,用10k的train/val 2007+test 2007和16k的train/val 2012作爲訓練集,test2012作爲測試集,分別彙報結果。

MSCOCO數據集

COCO數據集是微軟團隊發佈的一個可以用來圖像recognition+segmentation+captioning的數據集,該數據集收集了大量包含常見物體的日常場景圖片,並提供像素級的實例標註以更精確地評估檢測和分割算法的效果,致力於推動場景理解的研究進展。依託這一數據集,每年舉辦一次比賽,現已涵蓋檢測、分割、關鍵點識別、註釋等機器視覺的中心任務,是繼ImageNet Chanllenge以來最有影響力的學術競賽之一。相比ImageNet,COCO更加偏好目標與其場景共同出現的圖片,即non-iconic images。這樣的圖片能夠反映視覺上的語義,更符合圖像理解的任務要求。而相對的iconic images則更適合淺語義的圖像分類等任務。COCO的檢測任務共含有80個類,在2014年發佈的數據規模分train/val/test分別爲80k/40k/40k,學術界較爲通用的劃分是使用train和35k的val子集作爲訓練集(trainval35k),使用剩餘的val作爲測試集(minival),同時向官方的evaluation server提交結果(test-dev)。除此之外,COCO官方也保留一部分test數據作爲比賽的評測集。

Google Open Image數據集

pen Image是谷歌團隊發佈的數據集。最新發布的Open Images V4包含190萬圖像、600個種類,1540萬個bounding-box標註,是當前最大的帶物體位置標註信息的數據集。這些邊界框大部分都是由專業註釋人員手動繪製的,確保了它們的準確性和一致性。另外,這些圖像是非常多樣化的,並且通常包含有多個對象的複雜場景(平均每個圖像 8 個)。

ImageNet數據集

ImageNet是一個計算機視覺系統識別項目, 是目前世界上圖像識別最大的數據庫。ImageNet是美國斯坦福的計算機科學家,模擬人類的識別系統建立的。能夠從圖片識別物體。Imagenet數據集文檔詳細,有專門的團隊維護,使用非常方便,在計算機視覺領域研究論文中應用非常廣,幾乎成爲了目前深度學習圖像領域算法性能檢驗的“標準”數據集。Imagenet數據集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和圖像中物體位置的標註。

DOTA數據集

DOTA是遙感航空圖像檢測的常用數據集,包含2806張航空圖像,尺寸大約爲4kx4k,包含15個類別共計188282個實例,其中14個主類,small vehicle 和 large vehicle都是vehicle的子類。其標註方式爲四點確定的任意形狀和方向的四邊形。航空圖像區別於傳統數據集,有其自己的特點,如:尺度變化性更大;密集的小物體檢測;檢測目標的不確定性。數據劃分爲1/6驗證集,1/3測試集,1/2訓練集。目前發佈了訓練集和驗證集,圖像尺寸從800x800到4000x4000不等。

後面幾個數據集的具體介紹等我找到好博客再補上。。。

參考:

DeepLearning-500-questions

VOC數據集深入介紹

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章