目標檢測常用數據集介紹

原創

weixin_42784169

2020-05-12 11:17

以下介紹來自於github工程整理：DeepLearning-500-questions，具體gihub項目在文末參考。

PASCAL VOC數據集

VOC數據集深入介紹在文末參考，垃圾CSDN，有鏈接就不讓發。。。

VOC數據集是目標檢測經常用的一個數據集，自2005年起每年舉辦一次比賽，最開始只有4類，到2007年擴充爲20個類，共有兩個常用的版本：2007和2012。學術界常用5k的train/val 2007和16k的train/val 2012作爲訓練集，test 2007作爲測試集，用10k的train/val 2007+test 2007和16k的train/val 2012作爲訓練集，test2012作爲測試集，分別彙報結果。

MSCOCO數據集

COCO數據集是微軟團隊發佈的一個可以用來圖像recognition+segmentation+captioning的數據集，該數據集收集了大量包含常見物體的日常場景圖片，並提供像素級的實例標註以更精確地評估檢測和分割算法的效果，致力於推動場景理解的研究進展。依託這一數據集，每年舉辦一次比賽，現已涵蓋檢測、分割、關鍵點識別、註釋等機器視覺的中心任務，是繼ImageNet Chanllenge以來最有影響力的學術競賽之一。相比ImageNet，COCO更加偏好目標與其場景共同出現的圖片，即non-iconic images。這樣的圖片能夠反映視覺上的語義，更符合圖像理解的任務要求。而相對的iconic images則更適合淺語義的圖像分類等任務。COCO的檢測任務共含有80個類，在2014年發佈的數據規模分train/val/test分別爲80k/40k/40k，學術界較爲通用的劃分是使用train和35k的val子集作爲訓練集（trainval35k），使用剩餘的val作爲測試集（minival），同時向官方的evaluation server提交結果（test-dev）。除此之外，COCO官方也保留一部分test數據作爲比賽的評測集。

Google Open Image數據集

pen Image是谷歌團隊發佈的數據集。最新發布的Open Images V4包含190萬圖像、600個種類，1540萬個bounding-box標註，是當前最大的帶物體位置標註信息的數據集。這些邊界框大部分都是由專業註釋人員手動繪製的，確保了它們的準確性和一致性。另外，這些圖像是非常多樣化的，並且通常包含有多個對象的複雜場景（平均每個圖像 8 個）。

ImageNet數據集

ImageNet是一個計算機視覺系統識別項目，是目前世界上圖像識別最大的數據庫。ImageNet是美國斯坦福的計算機科學家，模擬人類的識別系統建立的。能夠從圖片識別物體。Imagenet數據集文檔詳細，有專門的團隊維護，使用非常方便，在計算機視覺領域研究論文中應用非常廣，幾乎成爲了目前深度學習圖像領域算法性能檢驗的“標準”數據集。Imagenet數據集有1400多萬幅圖片，涵蓋2萬多個類別；其中有超過百萬的圖片有明確的類別標註和圖像中物體位置的標註。

DOTA數據集

DOTA是遙感航空圖像檢測的常用數據集，包含2806張航空圖像，尺寸大約爲4kx4k，包含15個類別共計188282個實例，其中14個主類，small vehicle 和 large vehicle都是vehicle的子類。其標註方式爲四點確定的任意形狀和方向的四邊形。航空圖像區別於傳統數據集，有其自己的特點，如：尺度變化性更大；密集的小物體檢測；檢測目標的不確定性。數據劃分爲1/6驗證集，1/3測試集，1/2訓練集。目前發佈了訓練集和驗證集，圖像尺寸從800x800到4000x4000不等。

後面幾個數據集的具體介紹等我找到好博客再補上。。。

參考：

DeepLearning-500-questions

VOC數據集深入介紹

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

目標檢測常用數據集介紹

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

劍指offer-連續子數組的最大和（python和c++）

C++提高編程_04STL- 函數對象

劍指offer-平衡二叉樹(python和c++）

劍指offer-順時針打印矩陣(python和c++）

目標檢測常用數據集介紹

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結