卷积神经网络-深度可分离卷积

原創

weixin_38498942

2020-06-26 23:31

一、简介

MobileNet架构中提出的有空间可分离卷积和深度可分离卷积，本文中我们将着重介绍深度可分离卷积实现及其意义。

二、深度可分离卷积

空间可分离卷积：
从概念上讲，这是两者中较容易的一个，并说明了将一个卷积分成两部分（两个卷积核）的想法，所以我将从这开始。不幸的是，空间可分离卷积具有一些显着的局限性，这意味着它在深度学习中没有被大量使用。
空间可分卷积之所以如此命名，是因为它主要处理图像和卷积核（kernel）的空间维度：宽度和高度。（另一个维度，“深度”维度，是每个图像的通道数）。
空间可分离卷积简单地将卷积核划分为两个较小的卷积核。最常见的情况是将3x3的卷积核划分为3x1和1x3的卷积核，如下所示：

深度可分离卷积：
与空间可分离卷积不同，深度可分离卷积与卷积核无法“分解”成两个较小的内核。因此，它更常用。这是在keras.layers.SeparableConv2D或tf.layers.separable_conv2d中看到的可分离卷积的类型。
深度可分离卷积之所以如此命名，是因为它不仅涉及空间维度，还涉及深度维度（信道数量）。输入图像可以具有3个信道：R、G、B。在几次卷积之后，图像可以具有多个信道。类似于空间可分离卷积，深度可分离卷积将卷积核分成两个单独的卷积核，这两个卷积核进行两个卷积：深度卷积和逐点卷积。
深度卷积:
在第一部分，深度卷积中，我们在不改变深度的情况下对输入图像进行卷积。我们使用3个形状为5x5x1的内核。视频1:通过一个3通道的图像迭代3个内核：

每个5x5x1内核迭代图像的一个通道(注意:一个通道，不是所有通道)，得到每25个像素组的标量积，得到一个8x8x1图像。将这些图像叠加在一起可以创建一个8x8x3的图像。

逐点卷积:
记住，原始卷积将12x12x3图像转换为8x8x256图像。目前，深度卷积已经将12x12x3图像转换为8x8x3图像。现在，我们需要增加每个图像的通道数。逐点卷积之所以如此命名是因为它使用了一个1x1核函数，或者说是一个遍历每个点的核函数。该内核的深度为输入图像有多少通道;在我们的例子中，是3。因此，我们通过8x8x3图像迭代1x1x3内核，得到8x8x1图像。

我们可以创建256个1x1x3内核，每个内核输出一个8x8x1图像，以得到形状为8x8x256的最终图像。

三、总结

相同的输入，同样是得到4张Feature map，Separable Convolution的参数个数是常规卷积的约1/3。因此，在参数量相同的前提下，采用Separable Convolution的神经网络层数可以做的更深。深度可分离卷积的缺点是什么?当然!因为它减少了卷积中参数的数量，如果你的网络已经很小，你可能会得到太少的参数，你的网络可能无法在训练中正确学习。然而，如果使用得当，它可以在不显著降低效率的情况下提高效率，这使得它成为一个非常受欢迎的选择。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

卷积神经网络-深度可分离卷积

機器學習簡介（1）

機器學習簡介（2）

高通HVX簡介

高通HTA簡介

SNPE分析與評測 (2)

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結