Tensorflow2.0學習筆記（八）Resnet

原創

Jackilina_Stone

2020-06-23 08:45

1 退化問題？

2 ResNet的殘差學習單元（Residual Unit）

3 Resnet18

4 Resnet在不同層數時的網絡配置

1 退化問題？

在不斷增加神經網絡的深度時，會出現一個退化的問題：

準確率會先上升然後達到飽和，再持續增加網絡的深度則會導致準確率下降。

這並不是過擬合的問題，原因是不光在測試集上誤差增大，訓練集本身誤差也會增大。

2 ResNet的殘差學習單元（Residual Unit）

這個Residual block通過shortcut connection實現，通過shortcut將這個block的輸入和輸出進行加疊，這個簡單的加法並不會給網絡增加額外的參數和計算量，同時卻可以大大增加模型的訓練速度、提高訓練效果，並且當模型的層數加深時，這個簡單的結構能夠很好的解決退化問題。

class BasicBlock(layers.Layer):
    def __init__(self, filter_num, stride=1):
        super(BasicBlock, self).__init__()
        self.conv1 = layers.Conv2D(filter_num, (3, 3), strides=stride, padding='same')
        self.bn1 = layers.BatchNormalization()
        self.relu = layers.Activation('relu')
        self.conv2 = layers.Conv2D(filter_num, (3, 3), strides=1, padding='same')
        self.bn2 = layers.BatchNormalization()
        if stride != 1:
            self.downsample = Sequential()
            self.downsample.add(layers.Conv2D(filter_num, (1, 1), strides=stride))
        else:
            self.downsample = lambda x: x

    def call(self, inputs, training=None):
        out = self.conv1(inputs)
        out = self.bn1(out, training=training)
        out = self.relu(out)
        out = self.conv2(out)
        out = self.bn2(out, training=training)
        identity = self.downsample(inputs)
        output = layers.add([out, identity])
        output = tf.nn.relu(output)
        return output

3 Resnet18

class ResNet(keras.Model):
    def __init__(self, layer_dims, num_classes=2): 
        super(ResNet, self).__init__()
        self.stem = Sequential([layers.Conv2D(64, (3, 3), strides=(1, 1)),
                                layers.BatchNormalization(),
                                layers.Activation('relu'),
                                layers.MaxPool2D(pool_size=(2, 2), strides=(1, 1), padding='same')
                                ])
        self.layer1 = self.build_resblock(64,  layer_dims[0])
        self.layer2 = self.build_resblock(128, layer_dims[1], stride=2)
        self.layer3 = self.build_resblock(256, layer_dims[2], stride=2)
        self.layer4 = self.build_resblock(512, layer_dims[3], stride=2)
        self.avgpool = layers.GlobalAveragePooling2D()
        self.fc = layers.Dense(num_classes)

    def call(self, inputs, training=None):
        x = self.stem(inputs, training=training)
        x = self.layer1(x, training=training)
        x = self.layer2(x, training=training)
        x = self.layer3(x, training=training)
        x = self.layer4(x, training=training)
        x = self.avgpool(x)
        x = self.fc(x)
        return x

    def build_resblock(self, filter_num, blocks, stride=1):
        res_blocks = Sequential()
        res_blocks.add(BasicBlock(filter_num, stride))
        for _ in range(1, blocks):
            res_blocks.add(BasicBlock(filter_num, stride=1))
        return res_blocks


def resnet18():
    return ResNet([2, 2, 2, 2])

4 Resnet在不同層數時的網絡配置

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Tensorflow2.0學習筆記（八）Resnet

1 退化問題？

2 ResNet的殘差學習單元（Residual Unit）

3 Resnet18

4 Resnet在不同層數時的網絡配置

【python】實現錄屏

Tensorflow2.0學習筆記目錄

【雷達】毫米波雷達（77GHz FMCW）——測距原理

OPENCV：使用Grabcut算法進行物體分割

Tensorflow2.0學習筆記（八）Resnet

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結