網絡結構

作者所採用的基礎網絡爲resnet-50，在最後一個全連接層的前面加了一個Eigenlayer，其實就是一個全連接層，只不過對參數做了SVD分解，因此稱爲SVDNet。

對全連接層做SVD分解的原因是：全連接層是以向量內積形式進行特徵的相似性度量或者說分類，全連接層的權重之間存在相關性的，學出來的特徵也是有相關性的，而在Person Re-ID的普遍測試中是以歐式距離進行相似性度量的，因此存在一定的誤差。

訓練過程

step0：用加了全連接層的resnet-50在之前訓好的resnet-50上進行fine-tune直至收斂。
Restraint and Relaxation Iteration (RRI)：
- 去相關：將新加的全連接層的權重進行SVD分解 $W = U S V T$ 用US代替W，然後用WWT 的特徵向量代替權重。
- 約束：固定本層參數繼續fine-tune直至收斂。
- 鬆弛：不固定本層參數繼續fine-tune直至收斂。
重複RRI過程。

經過去相關和約束處理後，權重向量是正交的，但是這時候不一定收斂的很好，因此需要鬆弛步驟，然後不斷重複次過程。

爲什麼要用WWT 特徵向量來代替權重，而不是直接用US 來代替權重？

作者的回答是：SVD分解的奇異特徵向量的符號是不確定的，因此特徵投影到權重上後的方向是不確定的，因此用WWT 特徵向量來代替權重。

假設f爲Eigenlayer之後的輸出，則特徵之間的歐式距離爲

由於V爲酉矩陣，因此US 來替換W之後的相似性度量是不變的，即

作者的實驗也表明了這點

點評：SVD分解的想法很好，但是感覺略雞肋，可能是爲了發文章吧（望作者見諒），其實只需要將網絡稍微修改下，softmax也能到82%。可參考前一篇博客http://blog.csdn.net/q295684174/article/details/78744969

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.