【秋招復習——深度學習】ResNet、DenseNet

隨着cnn的發展，尤其是VGG網絡提出以後，大家發現網絡層數是網絡的一個關鍵因素，似乎越深的網絡效果越好。
但是隨着網絡層數的增加，也出現了梯度消失或者發散。從而導致訓練難以收斂。
隨着normalized initialization && intermediate normalization layers的提出解決了這個問題。
但是於此同時，隨着網絡深度的增加，系統精度得到飽和之後，迅速的下滑。讓人意外的是這個性能下降不是過擬合導致的

ResNet

我們提出一個 deep residual learning 框架來解決這種因爲深度增加而導致性能下降問題
假設我們期望的網絡層關係映射爲 H(x), 我們讓 the stacked nonlinear layers 擬合另一個映射， F(x):= H(x)-x , 那麼原先的映射就是 F(x)+x。這裏我們假設優化殘差映射F(x) 比優化原來的映射 H(x)容易。

殘差網絡單元其中可以分解成右圖的形式，從圖中可以看出，殘差網絡其實是由多種路徑組合的一個網絡，直白了說，殘差網絡其實是很多並行子網絡的組合，整個殘差網絡其實相當於一個多人投票系統（Ensembling）。

從這可以看出其實ResNet是由大多數中度網絡和一小部分淺度網絡和深度網絡組成的，說明雖然表面上ResNet網絡很深，但是其實起實際作用的網絡層數並沒有很深。
所示ResNet真的解決了深度網絡的梯度消失的問題了嗎？似乎沒有，ResNet其實就是一個多人投票系統。

DenseNet

DenseNet和ResNet最大的區別在於：
不在通過求和來組合，而是將他們全部作爲單獨的輸入提供到下一層的輸入。
密集連接這個詞給人的第一感覺就是極大的增加了網絡的參數量和計算量。但實際上 DenseNet 比其他網絡效率更高，其關鍵：網絡每層計算量的減少以及特徵的重複利用

特點：

網絡更窄，參數更少
每一層的輸入來自前面所有層的輸出
恐怖如斯的內存佔用

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【秋招復習——深度學習】ResNet、DenseNet

ResNet

DenseNet

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

【秋招復習——深度學習】ResNet、DenseNet

ARtoolkit源碼閱讀（一) artoolkit框架simpletest.c

525. Contiguous Array

336. Palindrome Pairs

535. Encode and Decode TinyURL

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結