騰訊優圖再次刷新三大ReID公開數據集紀錄，首位命中率最高近99%

原創

2020-06-09 19:38

近日，騰訊優圖實驗室在行人重識別（ReID）技術上再次取得突破，通過引入跨場景ReID，其ReID模型性能刷新了三大權威主流ReID公開數據集CUHK03，DUKE-MTMC和Market1501的記錄，算法關鍵指標首位命中率（RANK1 Accuracy）和平均精度均值（Mean Average Precision）獲得業內最好成績。

表1： ReID公開數據集性能比較

	Market1501		DukeMTMC		CUHK03
	RANK1	MAP	RANK1	MAP	RANK1	MAP
Tencent YouTu	98.99%	97.16%	95.15%	91.10%	95.79%	95.00%
YITU	98.60%	96.60%	94.75%	90.02%	95.00%	94.23%
HaiGe	97.54%	94.77%	94.37%	89.77%	94.40%	91.20%
ZTE	97.32%	94.66%	92.46%	87.65%	89.79%	87.99%
Dahua Tech	96.76%	91.98%	91.52%	83.96%	87.73%	85.72%
Pensees	96.73%	89.89%	92.01%	82.51%	84.57%	82.81%
WINSENSE	96.59%	91.77%	91.79%	83.81%	82.79%	81.91%
CloudWalk	96.40%	91.14%	91.74%	83.31%	82.28%	81.06%
Alibaba	96.35%	90.58%	90.31%	81.46%	82.00%	80.57%

數據來源於網絡

行人重識別（Person ReID）是指對不同攝像機捕捉到的行人圖像建立身份對應關係（即關聯行人ID），對行人實現在整個場景下的行動路線的全面刻畫。簡單來說，在看不到人臉的複雜多場景下也能通過體態等對人進行識別。相較於人臉識別技術，ReID對人體圖像的遮擋、朝向和清晰度具有較高的魯棒性，對攝像頭的清晰度、架設位置、角度沒有硬性要求。正因此ReID技術成爲繼人臉識別技術後計算機視覺領域又一熱門課題。

鑑於ReID技術的技術優勢和在各個領域的廣泛應用前景，近年來，騰訊優圖在這一方向上做出了大量技術投入和全面的技術佈局，在CVPR、TPAMI、AAAI、IJCAI等國際頂級學術會議和期刊上發表了超過15篇相關領域學術論文。

圖一：行人ReID示意圖

雖然ReID技術已經過多年的演進，但現實中複雜多變的場景，也讓跨場景識別（cross-domain person re-identification）成爲ReID技術的一大難題，此次騰訊優圖刷新三大數據集所引入的跨場景ReID，便是在此難點上進行了技術突破。

跨場景識別的難點在於，不同場景由於環境光照、攝像頭角度、背景等因素，例如室內大型商場、小型門店的側面和高俯角相機、室外道路、社區的強光和夜晚環境等，都會對人體圖像的視覺特徵造成影響。如何讓ReID技術適應複雜多變的場景，實現跨場景行人圖像的檢索，是一項重大的技術挑戰，也是實現室內外行人動線聯動、全城聯動的關鍵性技術。突破此技術難點對拓展ReID的落地場景和業態，實現大規模行人識別有巨大的作用。

圖二：公開數據集MSMT17中的室內外行人圖像視覺差異

爲解決ReID技術難點，騰訊優圖通過在遮擋匹配、全角度匹配、跨域檢索等業務問題上的針對性優化，以及在模型結構、損失函數、訓練算法等各項技術上的大量積累和創新，提出了一種跨場景行人重識別技術框架，採用基於圖卷積和孿生網絡的模型，使得神經網絡對多朝向、多姿態等跨場景的人體具有更強的識別能力。這一技術能夠爲不同場景、不同拍攝角度和光照條件的行人視覺特徵學習統一的特徵表達，有效提升了ReID技術在行人圖像室內外、跨場景的相互檢索的精度。

圖三：跨場景行人重識別

通過引入跨場景ReID，騰訊優圖在三個數據集中刷新業內最好的水平，其中Market-1501數據集的RANK1達到98.99%。RANK1和MAP作爲衡量ReID技術水平的核心指標，首位命中率高，就意味着算法能夠在衆多圖像中準確找出最容易識別或匹配的那張。

在此基礎上，騰訊優圖的ReID算法在多場景行人圖像相互檢索也處於業界領先水平，在跨場景ReID數據集MSMT-17上超越已有算法達到業內頂尖水平。

表2：跨場景行人重識別性能比較

	RANK1	MAP
Tencent YouTu	83.54%	62.00%
ABDNET (TAMU/中科大)	82.30%	60.80%
OSNET	78.70%	52.90%
DG-NET (NVIDIA/悉尼大學)	77.20%	52.30%
DLCE	60.48%	31.58%

騰訊優圖的ReID技術不僅在相關數據集上已經取得了領先的性能，依託ReID技術的應用系統也已在多種場景達到商用水平並實現廣泛落地。未來，隨着跨場景行人重識別能力的逐步成熟，騰訊優圖的ReID技術也將在更多的場景和業態實現價值。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

騰訊優圖再次刷新三大ReID公開數據集紀錄，首位命中率最高近99%

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

騰訊優圖開源深度學習推理框架TNN，助力AI開發降本增效

騰訊雲又又又發佈數據庫新品啦

騰訊多媒體實驗室：基於三維卷積神經網絡的全參考視頻質量評估算法

騰訊技術跨越2019

騰訊多媒體實驗室重磅開源視頻質量評估算法DVQA

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結