2.Network in Networks 論文總結

原創

红薯塔就是爱太阳啊

2020-06-08 21:47

目的：

改進CNN，可以學習到更加抽象和有效的非線性特徵

常規卷積層： conv→relu

conv： conv_out=∑(x·w)
relu： y=max(0， conv_out)

maxout： several conv(full)→max

maxout：一種激活函數形式
several conv (full): conv_out1 = x·w_1, conv_out2 = x·w_2, …
max： y = max(conv_out1, conv_out2, …)
線性變化+Max操作可以擬合任意的的凸函數

NIN： serveral conv(full)→relu→conv(1x1)→relu

several conv (full): conv_out1 = x·w_1, conv_out2 = x·w_2, …
relu: relu_out1 = max(0, conv_out1), relu_out2 = max(0, conv_out2), …
conv(1x1): conv_1x1_out = [relu_out1, relu_out2, …]·w_1x1
relu: y = max(0, conv_1x1_out)
NIN想表明：不僅能夠擬合任何凸函數，而且能夠擬合任何函數，因爲它本質上可以說是一個小型的全連接神經網絡

1.MLP Convolution Layers

mlpconv網絡層替代傳統的convolution層
mlpconv網絡層：卷積 + 傳統的mlp（多層感知器）
在跨通道（cross channel,cross feature map）情況下，mlpconv 等價於卷積層 + 1×1卷積層
1×1卷積層實現多個feature map的線性組合，實現跨通道的信息整合

CNN高層特徵是低層特徵通過某種運算的組合
在每個局部感受野中進行更加複雜的運算（包含一個微型的多層網絡），提高非線性
同一層中，不同特徵層之間（每一層之間的特徵提取又加上了一個小的神經網絡。）

2.Global Average Pooling

替代全連接層，減少參數
feature map數量等於category數量

傳統：卷積出現在底層網絡，最後一個卷積層的特徵圖通過量化送到全連接，接一個softmax邏輯迴歸分類層
（特徵提取+傳統網絡）
優化：卷積之後，對每個特徵圖一整張圖片進行全局均值池化，這樣每張特徵圖都可以得到一個輸出。
（每張特徵圖相當於一個輸出特徵，表示輸出類的特徵。）
特點：強化特徵圖與類別的關係，沒有參數需要進行優化

3.補充

仿射特徵圖(affine feature maps):是直接由線性卷積得到的特徵圖，沒有通過激活函數進行非線性映射。

4.重點知識

1×1卷積核：
（1）一個通道：同一個w去乘以原圖像上的每一個像素點，相當於做了一個scaling
（2）多個通道：實現跨通道的交互和信息整合
（卷積操作本身就可以做到各個通道的重新聚合的作用）
（3）卷積時：11* 11* 3* 96（11*11的卷積kernel，輸出map 96個）對於一個patch輸出96個點，是輸出feature map同一個像素的96個channel，但是現在多加了一層MLP，把這96個點做了一個全連接，又輸出了96個點——很巧妙，這個新加的MLP層就等價於一個1 * 1 的卷積層
（4）1 * 1的卷積可以看作是對每個feature map 對應的相關 patch 做全連接（加權求和）
the author’s goal was to generate a deeper network without simply stacking more layers.
It replaces few filters with a smaller perceptron layer with mixture of 1x1 and 3x3 convolutions. In a way,
it can be seen as “going wide” instead of “deep”,

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation論文解讀

（CVPR 2020｜中科院VIPL實驗室） 1.要解決的問題：基於類別標籤的弱監督語義分割是一個具有挑戰性的問題，類別響應圖（class activation map，簡稱CAM）始終是這一領域的基礎方法。但是由於強監督與弱監督信號之

2020-07-08 00:02:52

YOLO 論文解讀

You Only Look Once:Unified, Real-Time Object Detection 論文下載地址 github源碼地址簡介 YOLO是2016年CVPR的paper，這是RBG繼RCNN，fast-R

南有乔木NTU

2020-06-21 09:00:15

HRNet:打通多個視覺任務的全能骨幹網絡結構（分類，分割，檢測，姿態，風格等）

HRNet是微軟亞洲研究院的王井東老師領導的團隊完成的，打通圖像分類、圖像分割、目標檢測、人臉對齊、姿態識別、風格遷移、Image Inpainting、超分、optical flow、Depth estimation、邊緣檢測等

2020-06-19 18:10:20

【綜述】CNN中的池化操作-你見過的沒見過的池化這裏都有

池化操作(Pooling)是CNN中非常常見的一種操作，Pooling層是模仿人的視覺系統對數據進行降維，池化操作通常也叫做子採樣(Subsampling)或降採樣(Downsampling)，在構建卷積神經網絡時，往往會用在卷積

2020-06-19 18:10:19

一種構建網絡安全知識圖譜的實用方法——賈焰

文章鏈接：https://www.ixueshu.com/document/22cde1e97521595bc36aadb3dd6ff858318947a18e7f9386.html. 文章主要工作論述了構建網絡安全知識庫的三

2020-06-13 09:17:23

Two-Stream RNN/CNN for Action Recognition in 3D Videos－閱讀筆記

在youtube上看到這篇論文的視頻，做的效果還不錯，簡單閱讀一下： - 視頻鏈接：https://www.youtube.com/watch?v=G0PXKCEgIoA. - 論文鏈接：https://arxiv.org/a

2020-06-10 09:38:00

1. AlexNet 論文總結

1.網絡結構： imput Conv1 - ReLU - Maxpooling - RNL Conv2 - ReLU - Maxpooling - RNL Conv3 - ReLU Conv4 - ReLU Conv5 - R

红薯塔就是爱太阳啊

2020-06-08 21:47:16

3.VGG 論文總結

1. VGG：AlexNet的加強版（depth on its accuracy）結構對比（卷積層 --> 卷積羣） 2.實驗中VGG卷積層深度設置如上圖所示：紅色箭頭表示 : 每個網絡的結構設計（11層 -> 1

红薯塔就是爱太阳啊

2020-06-08 21:47:16

4.GoogLeNet 論文總結

1. 背景提高網絡性能 --> increasing size(depth,width) --> 缺點：大量參數所需的樣本難以獲得，增加了計算資源的使用（wasted） --> 解決方法：引入sparsity ( 稀疏

红薯塔就是爱太阳啊

2020-06-08 21:47:16

5.ResNet 論文總結

1.背景網絡的 depth 很重要 Is learning better networks as easy as stacking more layers? 問題：梯度消失/爆炸阻礙收斂。解決：添加 normalized

红薯塔就是爱太阳啊

2020-06-08 21:47:16

Image-to-Image Translation with Conditional Adversarial Networks 總結

cGAN： Conditional GAN — 在生成模型G和判別模型D中都加入條件信息來引導模型的訓練 a general-purpose solution to image-to-image translation p

红薯塔就是爱太阳啊

2020-06-08 21:47:16

RefineDet文章翻譯

2020-04-21 00:09:46

Deep SORT多目標跟蹤算法代碼解析

都开始麻辣

2020-04-20 20:06:40

增強CNN學習能力的Backbone:CSPNet

都开始麻辣

2020-03-30 03:31:08

卷積神經網絡中的各種池化操作

都开始麻辣

2020-03-11 12:56:33

24小時熱門文章

最新文章

最新評論文章