ImageOpenV4數據集解析

原創

南石北岸生

2020-06-02 00:23

2018.12.11更新：關於ImageOpenV4數據集

上次閱讀《百度視覺團隊參賽技術解剖》進行的分析。

https://blog.csdn.net/gusui7202/article/details/84259232

原始資料爲:https://baijiahao.baidu.com/s?id=1611471635767947365&wfr=spider&for=pc

關於ImageOpenV4，官網：https://storage.googleapis.com/openimages/web/download.html

下載的內容除了圖片就是.csv文件。

csv文件對於訓練集、測試集都分爲三種，以訓練集爲例，有一下三種：

1.train-images-boxable-with-rotation.csv

裏面的每一行主要的部分如下：

【圖片id，原圖url下載鏈接，版權信息等等，縮小到100k左右的圖像url下載鏈接】

2.train-annotations-bbox.csv

裏面的每一行主要部分如下：

【image_id，XMin,XMax,YMin,YMax（四個歸一化座標）】

3.train-images-boxable.csv

裏面的每一行主要部分如下：

【image_name, 原圖縮小到幾百k大小後的圖像url下載鏈接】

這裏需要強調，image_name等於image_id後面加.jpg。而後面鏈接下載下來的圖片名字，去掉.jpg後綴就是圖像的id。

直接從官網下的圖像，是這裏面的圖像，也就是縮小過的，並且圖像名字去掉後綴就是圖像id。

另外，一個圖像id對應三個圖片，一個是原圖，一個是原圖縮小一次後的，最後一個是圖像縮小之後再縮小。

也就是三個尺寸的圖像。大小分別是幾個M，幾百k，100k左右。我們下的圖片，就是幾百k的這個，也只有這個的圖片名字，纔是id，而原圖和原圖縮小兩次後的圖片，下載鏈接都在train-images-boxable-with-rotation.csv（上3點的第1點）中，它們的名字並非圖像id。幾個文件的關係如下：