【人脸关键点检测】

原創

2020-06-20 02:07

人脸关键点通常是基层的CNN然后连接FCN进行回归，这里计划将FCN改为全局加权平均池化来处理，意思说是卷积核的尺寸与输入map的尺寸相同，即K=H=W，则输出map为C∗1∗1即长度为CC的向量，此时称之为Global Depthwise Convolution（GDC），见MobileFaceNet，可以看成是全局加权池化，与 Global Average Pooling（GAP） 的不同之处在于，GDC 给每个位置赋予了可学习的权重（对于已对齐的图像这很有效，比如人脸，中心位置和边界位置的权重自然应该不同），而GAP每个位置的权重相同，全局取个平均，如图：

https://www.pianshen.com/article/76591199542/

替代FCN的好处：

全连接层的缺点
全连接层有一个非常致命的弱点就是参数量过大，特别是与最后一个卷积层相连的全连接层。一方面增加了Training以及testing的计算量，降低了速度；另外一方面参数量过大容易过拟合。虽然使用了类似dropout等手段去处理，但是毕竟dropout是hyper-parameter，不够优美也不好实践。

GAP(Global Average Pooling)可以取代全连接层

我们要明确以下，全连接层将卷积层展开成向量之后不还是要针对每个feature map进行分类吗，GAP的思路就是将上述两个过程合二为一，一起做了。如图所示：

上面操作不禁让我想到采用深度可分离卷积来进行处理，这篇文章居然已经用了该思路！https://blog.csdn.net/u011995719/article/details/79435615

大致在回想下深度可分离卷积原理：用单层卷积核分别和通道特征图分别卷积，如果卷积核尺寸和特征图尺寸相同，则每个通道生成一个值，这个值作为关键点的一个座标即可；

下图是常规CNN和深度可分类CNN示意图：https://blog.csdn.net/tintinetmilou/article/details/81607721

本次采用keras框架进行处理，我们看下keras的深度可分离卷积DepthwiseConv2D：

https://blog.csdn.net/c_chuxin/article/details/88581411

keras.layers.DepthwiseConv2D(kernel_size, strides=(1, 1), padding='valid', depth_multiplier=1, data_format=None, activation=None, use_bias=True, depthwise_initializer='glorot_uniform', bias_initializer='zeros', depthwise_regularizer=None, bias_regularizer=None, activity_regularizer=None, depthwise_constraint=None, bias_constraint=None)

理论思考完毕；实践马上到来：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【人脸关键点检测】

如何使用 JS 判断用户是否处于活跃状态

lightdb秒级增加列和删除列（not null带默认值）

lightdb数据库超时相关控制参数

通过HPA+CronHPA组合应对业务复杂弹性伸缩场景

❤️‍🔥 Solon Cloud Event 新的事务特性与应用

lightdb mysql 8.0兼容之不可见主键

使用 JS 实现在浏览器控制台打印图片 console.image()

基于Ubuntu-22.04安装K8s-v1.28.2实验（四）使用域名访问网站应用

openvino實現圖像超分辨

unet魔改那些事二——代碼整理

keras框架下dense_unet對稻田草地分割

圖像顏色直方圖和HOG特徵匹配opencv3

OpenVINO---Human Pose Estimation模型C++和cpu環境下推理測試

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結