深度學習在人臉識別領域的應用（2）

原創

小雪糕

2020-02-25 00:31

Deep Convolutional Network Cascade for Facial Point Detection

本文是CVPR2013湯曉歐課題組的最新工作，利用級聯深度卷積網絡進行面部特徵點定位。

1. Deep Covolutional Network

Deep Covolutional Network深度卷積神經網絡，正是我們所熟悉的CNN（Covolutioanl neural network），CNN在上了世紀末年就已經成型[1]，現如今深度學習如日中天，加個Deep頓時就高端起來了。

Figure.1 給出了Deep CNN的結構圖，Deep CNN通過多層的卷積結構來提取層次特徵(Hierarchical Feature)，並通過max-pooling層下采樣獲取不變性，最後通過最上層一個全連接的MLP(hidden layer + logistic regression)[2]來實現分類。

2. Cascaded Convolutional Network

圖2是整個系統的結構圖，“Cascaded"就體現在這樣的一個層次結構上，F1、EN1和NM1首先是一層粗的定位，後面再通過更加精細LE21等第二層檢測器以及LE31等第三層檢測器實現更爲精細的位置修正。圖中的黃色區域是每層檢測器的掃描區域。注意第一層卷積網絡的標識爲Deep CNN，這表示第一層網絡所採用的是Figure.1所示的深度結構。注意，LE21和LE22都是用來預測左眼中心的位置，區別在於掃描區域。

3. 實現細節

Level 1-3的網絡結構見下表：

注意Level2-3所採用的網絡結構均爲S2。

下表則給出了的Level 2-3各個卷積網絡的掃描區域。

從Table2可以清晰的看出LE21和LE22在掃描區域上的區別。

4. 實驗

Figure.4比較了多種網絡結構，Figure.5顯示了多層級聯結構的優勢。：

Figure.6 在BioID和LFPW兩個庫上將本文方法與state-of-the-art方法進行了比較。可見本文方法的性能相比傳統方法有較大提升（50% Accuracy improvement）。

Figure.8給出了一些檢測結果，本文作者用C++實現了該方法，檢測速度爲0.12second/per image，相當於8frames/s，客觀的說，這個速度不算快，但是檢測精度的確非常給力。

參考文獻

[1] LeNet-5

[2] Multilayer Perceptron

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

深度學習在人臉識別領域的應用（2）

redis的key亂碼問題和值自增問題

CORS error 但是 status code 是200 OK

一個開源且全面的C#算法實戰教程

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

壓縮上傳的GPU數據的方案

OpenTelemetry 實踐指南：歷史、架構與基本概念

需求管理祕籍：從混亂到有序，讓你的項目高效運轉

使用skopeo同步鏡像

用光線投射法渲染規則模型

C++模板類的繼承1 ：模板類繼承模板類

Matlab Cell數組元素查找

Matlab大數據處理1：Matlab內存映射文件

C++模板類的繼承2：普通類繼承模板類

基於SIMD指令的內積運算

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結