【DeepID】人臉識別模型之DeepID框架

原創

2020-04-23 03:37


論文名稱	Deep Learning Face Representation from Predicting 10,000 Classes
作者	miclover
參考
摘要
通過深度神經網絡來提取人臉深層次的特徵，稱爲深度隱藏身份特徵(deep hidden IDentity features, DeepID)，用於人臉驗證。在對深層次的特徵提取之後，結合分類器進行分類，文中使用了兩種分類方法：聯合貝葉斯人臉校驗（ Joint Bayesian）和神經網絡方法（neural network）。

一、特徵提取過程箭頭表示正向傳播方向。每一層是神經元個數標記如下。從每個卷積神經網絡的最後一個隱層提取深度人臉特徵，並在最後一層使用softmax進行分類。特徵數沿着特徵提取逐層減少，直到DeepID層。論文中說，一共被訓練有60個不同參數的深度網絡，每一個網絡有兩個特徵塊（一張人臉將被得分成60塊2，這裏的2是指對那60個塊進行翻轉或對稱）被傳入。DeepID層得到160維度的特徵，因此DeepID總共將獲得260*160 = 19200維度特徵，作爲最後被提取的人臉特徵。再下圖中Identity classes個人理解是爲了方便可以讓網絡正常訓練而使用的，在訓練過程有用，在測試階段則是使用DeepID層特徵來分類。二、Deep ConvNets 長方體的長度、寬度和高度表示所有輸入層、卷積層和最大池化層的映射數和每個映射的維數。內部的小長方體和正方形分別表示卷積層和maxpooling層的3D卷積核大小和2D pooling區域大小。每一層的旁邊都標有最後兩層完全連接的神經元數目三、Feature extraction 對於一張人臉圖片，在經過人臉檢測和人臉對齊之後，作者按照瞳孔和嘴的位置對所有訓練樣本進行了對齊（保證後面的切片工作是同一尺度下的），然後根據特徵點的位置，進行了切塊提取。如下圖所示： 1）上半部分是按要求對一張人臉提取十個不同的位置。左上角的5個區域是從排列較弱的人臉中提取的全局區域，右上角的5個區域是以5個面部標誌(兩個眼睛中心、鼻尖和兩個鼠標角)爲中心的局部區域。 2）下半部分，對這十張分別進行2次尺度變化，得到30張不同位置的人臉。 3）又對上述30張RGB圖片，提取了灰度圖像上的特徵，這樣就變成60張了 4）之後每一張圖作對稱或水平翻轉，變成了120張四、Face verification 使用卷積神經網絡或者聯合貝葉斯等分類器，對特徵進行分類，如下圖，卷積神經網絡輸出1或者0，表示是不是相同。