2018.12.11更新:關於ImageOpenV4數據集
上次閱讀《百度視覺團隊參賽技術解剖》進行的分析。
https://blog.csdn.net/gusui7202/article/details/84259232
原始資料爲:https://baijiahao.baidu.com/s?id=1611471635767947365&wfr=spider&for=pc
關於ImageOpenV4,官網:https://storage.googleapis.com/openimages/web/download.html
下載的內容除了圖片就是.csv文件。
csv文件對於訓練集、測試集都分爲三種,以訓練集爲例,有一下三種:
1.train-images-boxable-with-rotation.csv
裏面的每一行主要的部分如下:
【圖片id,原圖url下載鏈接,版權信息等等,縮小到100k左右的圖像url下載鏈接】
2.train-annotations-bbox.csv
裏面的每一行主要部分如下:
【image_id,XMin,XMax,YMin,YMax(四個歸一化座標)】
3.train-images-boxable.csv
裏面的每一行主要部分如下:
【image_name, 原圖縮小到幾百k大小後的圖像url下載鏈接】
這裏需要強調,image_name等於image_id後面加.jpg。而後面鏈接下載下來的圖片名字,去掉.jpg後綴就是圖像的id。
直接從官網下的圖像,是這裏面的圖像,也就是縮小過的,並且圖像名字去掉後綴就是圖像id。
另外,一個圖像id對應三個圖片,一個是原圖,一個是原圖縮小一次後的,最後一個是圖像縮小之後再縮小。
也就是三個尺寸的圖像。大小分別是幾個M,幾百k,100k左右。我們下的圖片,就是幾百k的這個,也只有這個的圖片名字,纔是id,而原圖和原圖縮小兩次後的圖片,下載鏈接都在train-images-boxable-with-rotation.csv(上3點的第1點)中,它們的名字並非圖像id。幾個文件的關係如下:
幾個大小的對比如下:
---------
如果.csv文件太大打不開,可以試試LogView。
感謝 angela0003 的討論.
----------