論文:Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks
在這裏論文中將其他的feature 成爲 FRF(Face Recognition Features)
論文提及的新的特徵稱爲FAF(Face Attribute Features),(即臉部屬性,如眉毛粗度,頭髮顏色,膚色等等)
FRF 有很強的區分性,但是魯棒性不強
FAR有很強的魯棒性, 但區分性不強
提出一種結構:
由兩個網絡組成:LeanFace,AttNet
(其中LeanFace在LFW上的準確率爲99.57%, AttNet爲79.07%)
通過GTNN將上述兩個網絡結合後的準確率爲99.65%
即實際通過LeanFace附加AttNet後提升0.08的準確率
(LeanFace和AttNet是分別訓練,結合後再進行fine-tuning)
GTNN爲新提出的合併結構:
其中利用了Tucker Decomposition
(合併詳情見論文)
個人認爲論文中將兩組特徵融合提高效果的GTNN網絡十分有價值,應該可以嘗試將其他的特徵融合或者應用到其他網絡或領域
(摘自 知乎) Method: 兩個特徵用tensor連接可以用於特徵融合. 融合的效果取決於tensor參數優化的效果.
但tensor的維度很高, 難以優化,
我們使用TUCKER張量分解的方式降低待優化的tensor的維度,即使這樣優化仍然面臨着求導及正則化設計的困難.
我們發現這個tensor優化問題可以與一個gated的人工神經網絡進行等價. 發現這個等價後, 我們可以1)
使用現有深度學習的優化工具進行優化, 如tensorflow, 而不需要手動設計複雜的tensor的優化.
由於在tensorflow優化時可以用mini-batch, 這樣我們的優化天然就是scalable的 2)
融合部分可以與特徵學習的神經網絡進行端到端的學習. 這篇論文提供的一個insight是,將tensor和深度學習進行等價.
這樣tensor領域的知識可以用來理解神經網絡, 反之亦然.