ImageOpenV4數據集解析

2018.12.11更新:關於ImageOpenV4數據集

上次閱讀《百度視覺團隊參賽技術解剖》進行的分析。

https://blog.csdn.net/gusui7202/article/details/84259232

原始資料爲:https://baijiahao.baidu.com/s?id=1611471635767947365&wfr=spider&for=pc

關於ImageOpenV4,官網:https://storage.googleapis.com/openimages/web/download.html

下載的內容除了圖片就是.csv文件。

csv文件對於訓練集、測試集都分爲三種,以訓練集爲例,有一下三種:

1.train-images-boxable-with-rotation.csv 

裏面的每一行主要的部分如下:

【圖片id,原圖url下載鏈接,版權信息等等,縮小到100k左右的圖像url下載鏈接】

2.train-annotations-bbox.csv

裏面的每一行主要部分如下:

【image_id,XMin,XMax,YMin,YMax(四個歸一化座標)】

3.train-images-boxable.csv

裏面的每一行主要部分如下:

【image_name,  原圖縮小到幾百k大小後的圖像url下載鏈接】

這裏需要強調,image_name等於image_id後面加.jpg。而後面鏈接下載下來的圖片名字,去掉.jpg後綴就是圖像的id。

直接從官網下的圖像,是這裏面的圖像,也就是縮小過的,並且圖像名字去掉後綴就是圖像id。

另外,一個圖像id對應三個圖片,一個是原圖,一個是原圖縮小一次後的,最後一個是圖像縮小之後再縮小。

也就是三個尺寸的圖像。大小分別是幾個M,幾百k,100k左右。我們下的圖片,就是幾百k的這個,也只有這個的圖片名字,纔是id,而原圖和原圖縮小兩次後的圖片,下載鏈接都在train-images-boxable-with-rotation.csv(上3點的第1點)中,它們的名字並非圖像id。幾個文件的關係如下:

 

幾個大小的對比如下:

---------

如果.csv文件太大打不開,可以試試LogView。

感謝 angela0003 的討論.

----------

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章