dlib 人脸识别论文 One Millisecond Face Alignment with an Ensemble of Regression Trees

论文连接:One Millisecond Face Alignment with an Ensemble of Regression Trees

1.简介

本文也采用级联回归树。

本论文主要解决两个问题:

1.抽取向量特征用于表征复杂背景和不同光照下的人脸图片。但在实际中实现时,既需要可信的特征用来预测人脸形状,同时又需要用精确地人脸形状来抽取特征。对于这种两难的情况,本文采用迭代式逼近的方法解决。在对样本抽取特征时,不对其基于全局座标进行抽取,而是基于当前预测shape下的抽取,所以这些抽取的特征用于预测的时shape的更新向量。这个过程会重复多次直至收敛。

2.在预测阶段,需要预测一个高维的空间向量来表征最拟合样本和训练模型的人脸形状。这是一个非凸问题,并存在多个局部极值。本文假设所能被预测到的人脸形状,均被包含在训练数据的子空间中(可以通过对训练数据中的一个样本,通过移动,旋转,仿射变换得到)。

通过优化mse训练每一颗树。通过一个集合的梯度提升树和先验概率分布,得到回归器的输入。先验概率可以时boosting算法能够高效地筛选大数量级的相关特征。

2.方法

2.1 级联回归器

使用x_{i}\epsilon R^{2}代表图片 I 第 i 个关键点的x和y座标。那么向量S=(x^{T}_{1}, x^{T}_{2}, ..., x^{T}_{p})^{T}\epsilon R^{2p}代表图片 I 中所有的 p 个关键点。使用Ŝ ^{(t)}表示当前预测出的形状向量 S。对于每一个回归器 ,r_{t}(.,.),通过累加更新向量来修正预测:

Ŝ ^{(t+1)} = Ŝ ^{(t)}+  r_{t}(I, Ŝ ^{(t)} )

每一个回归器的特征,都是通过原图和当前预测的 Ŝ ^{(t)} 计算出来的像素强度值。因为所有预测结果均是通过初始状态 Ŝ ^{(0)}变换而来,所以可以保证其存在于训练数据的子空间中,而不需要添加额外的约束,简化了算法

2.2 每一个回归树的训练

假设存在训练样本(I_{1}, S_{1}) (I_{1}, S_{1}), ... , (I_{n}, S_{n})​​​​​​​, I_{i} 代表第 i 个人脸图片,S_{i}代表其对应的人脸关键点向量。那么训练数据

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章