【DeepID】人臉識別模型之DeepID框架

論文名稱
Deep Learning Face Representation from Predicting 10,000 Classes
作者
miclover
參考
 
摘要
       通過深度神經網絡來提取人臉深層次的特徵,稱爲深度隱藏身份特徵(deep hidden IDentity features, DeepID),用於人臉驗證。在對深層次的特徵提取之後,結合分類器進行分類,文中使用了兩種分類方法:聯合貝葉斯人臉校驗( Joint Bayesian)和 神經網絡方法(neural network)
  
一、特徵提取過程
       箭頭表示正向傳播方向。每一層是神經元個數標記如下。從每個卷積神經網絡的最後一個隱層提取深度人臉特徵,並在最後一層使用softmax進行分類。特徵數沿着特徵提取逐層減少,直到DeepID層。
       論文中說,一共被訓練有60個不同參數的深度網絡,每一個網絡有兩個特徵塊(一張人臉將被得分成60塊*2,這裏的2是指對那60個塊進行翻轉或對稱)被傳入。DeepID層得到160維度的特徵,因此DeepID總共將獲得2*60*160 = 19200維度特徵,作爲最後被提取的人臉特徵。再下圖中Identity classes個人理解是爲了方便可以讓網絡正常訓練而使用的,在訓練過程有用,在測試階段則是使用DeepID層特徵來分類。
 

 
二、Deep ConvNets
       長方體的長度、寬度和高度表示所有輸入層、卷積層和最大池化層的映射數和每個映射的維數。內部的小長方體和正方形分別表示卷積層和maxpooling層的3D卷積核大小和2D pooling區域大小。每一層的旁邊都標有最後兩層完全連接的神經元數目
 
 

三、Feature extraction
       對於一張人臉圖片,在經過人臉檢測和人臉對齊之後,作者按照瞳孔和嘴的位置對所有訓練樣本進行了對齊(保證後面的切片工作是同一尺度下的),然後根據特徵點的位置,進行了切塊提取。
       如下圖所示:
       1)上半部分是按要求對一張人臉提取十個不同的位置。左上角的5個區域是從排列較弱的人臉中提取的全局區域,右上角的5個區域是以5個面部標誌(兩個眼睛中心、鼻尖和兩個鼠標角)爲中心的局部區域。
       2)下半部分,對這十張分別進行2次尺度變化,得到30張不同位置的人臉。
       3)又對上述30張RGB圖片,提取了灰度圖像上的特徵,這樣就變成60張了
       4)之後每一張圖作對稱或水平翻轉,變成了120張
 
 

四、Face verification
      使用卷積神經網絡或者聯合貝葉斯等分類器,對特徵進行分類,如下圖,卷積神經網絡輸出1或者0,表示是不是相同。
 

 
 
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章