One-Shot Video-Based Person Re-Identification by Stepwise Learning (comment)

Exploit the Unknown Gradually: One-Shot Video-Based Person Re-Identification by Stepwise Learning (Sydney大學)

用未標註樣本解決單標註樣本下的視頻行人重識別問題

逐漸利用未標註樣本,來解決單標註樣本(one-shot)情況下的視頻行人重識別問題(video-based person re-ID)

(跨視頻標註成本高)

 

通過特徵空間裏面的最近鄰 (Nearest neighbor) 分類方式,去給每個未標註數據分配 pseudo label。

一開始用有標註的數據來初始化訓練 CNN 模型,之後在每一次循環中我們(1)挑選可信的 pseudo-labeled 數據 2. 用標註數據和 pseudo-labeled 數據一起來更新 CNN 模型。我們通過逐步增大每次加入訓練的 pseudo-labeled 數據量,從而逐漸去利用更難識別的,包含更多信息多樣性的視頻片段。

 

這裏有兩個值得注意的點:

(1)如何決定每次選取多少 pseudo-labeled 數據做訓練

我們用一種動態測量,逐漸增加選取的樣本。在開始的循環中,只有一小部分 pseudo-labeled 數據被選中,之後會有越來越多樣本被加進來。我們發現增加樣本容量的速度越慢,即每一步迭代比上一步增加的 pseudo-labeled 樣本越少(對應需要的迭代次數更多),模型的性能越高。pseudo-labeled 樣本量的增長速度對模型最終性能的影響十分顯著。

 

(2)如何去給一個未標註數據分配 pseudo label 並量化其可信程度?

跟之前大部分 re-ID 的方法一樣,我們的訓練時採用的也是一個行人分類網絡,因此對於未標註樣本,網絡分類的預測值(Classification score)是可以用來預測標籤並判斷標籤置信度的。但是這樣的分類層在樣本量很少,特別是我們這種每個類只有一個樣本的情況下的情況下是不太可靠的。

同時我們注意到行人重識別(re-ID)的測試過程是一個計算特徵之間距離並進行檢索的過程,所以我們從這個角度出發,也去計算未標註數據與標註數據之間的距離(Dissimilarity cost criterion)。對於每個未標註的樣本,我們把離它最近的有標註樣本的類別賦予它作爲 pseudo label,並且將他們之間的距離作爲標籤估計的置信度。

 

解讀:https://www.leiphone.com/news/201806/o8a3H5um1H2zXrof.html

github: https://github.com/Yu-Wu/Exploit-Unknown-Gradually

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章