行人重識別 CUHK03數據集描述
簡要描述:
MATLAB數據文件格式,1467個行人,收集自The Chinese University of Hong Kong校園內的10個(5對)不同的攝像頭。
數據集結構:
由三部分組成:
--- "detected":行人框由pedestrian detector繪出,5x1 cell,分別由5對攝像頭組收集得到。
-- 843x10 cell,收集自攝像頭組pair 1,行數爲行人索引,前5列和後5列分別來自同一組的不同攝像頭。cell內每個元素爲一幅 MxNx3 的行人框圖像(uint8 數據類型),個別圖像可能空缺,爲空集。
-- 440x10 cell,收集自攝像頭組pair 2,其它同上。
-- 77x10 cell,收集自攝像頭組pair 3,其它同上。
-- 58x10 cell,收集自攝像頭組pair 4,其它同上。
-- 49x10 cell,收集自攝像頭組pair 5,其它同上。
--- "labeled" :5x1 cell,行人框由人類標註,格式和內容大致和上面的"detected"相同。
--- "testsets" :20x1 cell,測試協議。由20個 100x2 double類型矩陣組成。
-- 100x2 double,100行代表100個測試樣本,第1列爲攝像頭pair索引,第2列爲行人索引。
-- ...
測試協議:
CUHK-03的測試協議有兩種。
第一種爲舊的版本(參考文獻[1], 即數據集的出處 ),參見數據集中的'testsets'測試協議。具體地說,即隨機選出100個行人作爲測試集,1160個行人作爲訓練集,100個行人作爲驗證集(這裏總共1360個行人而不是1467個,這是因爲實驗中沒有用到攝像頭組pair 4和5的數據),重複二十次。這種測試協議是single-shot setting.
第二種測試協議(參考文獻[2] )類似於Market-1501,它將數據集分爲包含767個行人的訓練集和包含700個行人的測試集。在測試階段,我們隨機選擇一張圖像作爲query,剩下的作爲gallery,這樣的話,對於每個行人,有多個ground truth在gallery中。(新測試協議可以參考這裏)
數據集下載地址:
Google Drive:
https://drive.google.com/file/d/0BxJeH3p7Ln48djNVVVJtUXh6bXc/edit?usp=sharing
Baidu Cloud Disk ( password: rhjq ):
http://pan.baidu.com/s/1mgklxSc
參考文獻: