深度學習在人臉識別領域的應用(2)

         Deep Convolutional Network Cascade for Facial Point Detection

       本文是CVPR2013湯曉歐課題組的最新工作,利用級聯深度卷積網絡進行面部特徵點定位。

1. Deep Covolutional Network

        Deep Covolutional Network深度卷積神經網絡,正是我們所熟悉的CNN(Covolutioanl neural network),CNN在上了世紀末年就已經成型[1],現如今深度學習如日中天,加個Deep頓時就高端起來了大笑

     

           Figure.1 給出了Deep CNN的結構圖,Deep CNN通過多層的卷積結構來提取層次特徵(Hierarchical Feature),並通過max-pooling層下采樣獲取不變性,最後通過最上層一個全連接的MLP(hidden layer + logistic regression)[2]來實現分類。


2. Cascaded Convolutional Network

    

          圖2是整個系統的結構圖,“Cascaded"就體現在這樣的一個層次結構上,F1、EN1和NM1首先是一層粗的定位,後面再通過更加精細LE21等第二層檢測器以及LE31等第三層檢測器實現更爲精細的位置修正。圖中的黃色區域是每層檢測器的掃描區域。注意第一層卷積網絡的標識爲Deep CNN,這表示第一層網絡所採用的是Figure.1所示的深度結構。注意,LE21和LE22都是用來預測左眼中心的位置,區別在於掃描區域

3. 實現細節

     Level 1-3的網絡結構見下表:

    

      注意Level2-3所採用的網絡結構均爲S2。

      下表則給出了的Level 2-3各個卷積網絡的掃描區域。

      

       從Table2可以清晰的看出LE21和LE22在掃描區域上的區別。

4. 實驗

     Figure.4比較了多種網絡結構,Figure.5顯示了多層級聯結構的優勢。:

      

         

           

       Figure.6 在BioID和LFPW兩個庫上將本文方法與state-of-the-art方法進行了比較。可見本文方法的性能相比傳統方法有較大提升(50% Accuracy improvement)。

      Figure.8給出了一些檢測結果,本文作者用C++實現了該方法,檢測速度爲0.12second/per image,相當於8frames/s,客觀的說,這個速度不算快,但是檢測精度的確非常給力。

     

     

參考文獻

[1] LeNet-5

[2] Multilayer Perceptron




      

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章