dlib 人臉識別論文 One Millisecond Face Alignment with an Ensemble of Regression Trees

論文連接:One Millisecond Face Alignment with an Ensemble of Regression Trees

1.簡介

本文也採用級聯迴歸樹。

本論文主要解決兩個問題:

1.抽取向量特徵用於表徵複雜背景和不同光照下的人臉圖片。但在實際中實現時,既需要可信的特徵用來預測人臉形狀,同時又需要用精確地人臉形狀來抽取特徵。對於這種兩難的情況,本文采用迭代式逼近的方法解決。在對樣本抽取特徵時,不對其基於全局座標進行抽取,而是基於當前預測shape下的抽取,所以這些抽取的特徵用於預測的時shape的更新向量。這個過程會重複多次直至收斂。

2.在預測階段,需要預測一個高維的空間向量來表徵最擬合樣本和訓練模型的人臉形狀。這是一個非凸問題,並存在多個局部極值。本文假設所能被預測到的人臉形狀,均被包含在訓練數據的子空間中(可以通過對訓練數據中的一個樣本,通過移動,旋轉,仿射變換得到)。

通過優化mse訓練每一顆樹。通過一個集合的梯度提升樹和先驗概率分佈,得到迴歸器的輸入。先驗概率可以時boosting算法能夠高效地篩選大數量級的相關特徵。

2.方法

2.1 級聯迴歸器

使用x_{i}\epsilon R^{2}代表圖片 I 第 i 個關鍵點的x和y座標。那麼向量S=(x^{T}_{1}, x^{T}_{2}, ..., x^{T}_{p})^{T}\epsilon R^{2p}代表圖片 I 中所有的 p 個關鍵點。使用Ŝ ^{(t)}表示當前預測出的形狀向量 S。對於每一個迴歸器 ,r_{t}(.,.),通過累加更新向量來修正預測:

Ŝ ^{(t+1)} = Ŝ ^{(t)}+  r_{t}(I, Ŝ ^{(t)} )

每一個迴歸器的特徵,都是通過原圖和當前預測的 Ŝ ^{(t)} 計算出來的像素強度值。因爲所有預測結果均是通過初始狀態 Ŝ ^{(0)}變換而來,所以可以保證其存在於訓練數據的子空間中,而不需要添加額外的約束,簡化了算法

2.2 每一個迴歸樹的訓練

假設存在訓練樣本(I_{1}, S_{1}) (I_{1}, S_{1}), ... , (I_{n}, S_{n})​​​​​​​, I_{i} 代表第 i 個人臉圖片,S_{i}代表其對應的人臉關鍵點向量。那麼訓練數據

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章