CUHK數據集和Market-1501數據集計算CMC方法的差別

原創

hyk_1996

2018-09-04 12:36

Cumulative Matching Characteristics (CMC) curves 是目前行人重識別領域最流行的性能評估方法。考慮一個簡單的 single-gallery-shot 情形，每個gallery identity只有一個instance. 對於每一次的query, 算法將根據 query 到所有gallery samples的距離從小到大排序，CMC top-k accuracy 計算如下：

Acc_k = 1, if top-k ranked gallery samples contain query identity

Acc_k = 0, otherwise

這是一個 shifted step function, 最終的CMC curve 通過對所有queries的shifted step functions取平均得到。

儘管在 single-gallery-shot 情形下，CMC 有很明確的定義，但是在 multi-gallery-shot 情形下，它的定義並不明確，因爲每個gallery identity 可能存在多個instances. 例如, CUHK-03 和 Market-1501 數據集計算 CMC curves 和 CMC top-k accuracy 的方法很不同：

CUHK03: 這個數據集中，query 和 gallery 集來自不同的攝像頭視角。對於每個query, 隨機地從每個 gallery identity 中採樣一個instance, 然後以 single-gallery-shot 的方式計算 CMC curve. 隨機採樣重複N次，最終輸出CMC curve.

Market-1501: Query 和 gallery 集可能來自相同的攝像頭視角，但是對於每個query identity, 他/她的來自同一個攝像頭的 gallery samples 會被排除掉。對於每個 gallery identity，他們不會只隨機採樣一個instance. 這意味着在計算CMC時， query 將總是匹配 gallery 中“最簡單”的正樣本，而不關注其他更難識別的正樣本。

由上面可以看出，在 multi-gallery-shot 情形下，CMC評估具有缺陷。因此，也使用 mAP（mean average precsion）作爲評估指標。mAP可認爲是PR曲線下的面積，即平均的查準率。

參考自open-reid文檔：

https://cysu.github.io/open-reid/notes/evaluation_metrics.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

CUHK數據集和Market-1501數據集計算CMC方法的差別

SQL優化-20231016

Linux Ubuntu 筆記（長期更新）

PyTorch踩過的坑（長期更新，轉載請註明出處）

LaTeX 系列(2) —— 中文支持

Voice Conversion using Convolutional Neural Networks 翻譯

數據結構和算法筆記（2）基礎算法模板

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結