【圖像分類】更深的網絡VGGNet

原創

2020-02-22 03:01

1.VGGNet概述：

VGGNet在AlexNet基礎上創建了更深層的網絡，與GoogLeNet一起在2014年image net競賽中表現出色。VGGNet和GoogLeNet一起進一步提升了深度學習在圖像領域的表現。VGGNet證明了在一定程度上隨着網絡的加深，網絡的能力也有明顯的提高。

2.VGGNet網絡結構

VGGNet網絡中提供了多種網絡結構，A-E的網絡結構是基本一致的，最大的區別在於結構中卷積核的數量和大小不同，目前普遍使用的是D，E兩種結構，即爲人熟知的VGG16和VGG19。

以VGG16爲例：

input圖像輸入爲224*224*3

第一層結構：3*3*64串聯3*3*64串聯maxpooling。此層結構採用了3*3的卷積核進行串聯，這個串聯結構是VGG的首創，並且取得了非常不錯的結果。

第二層結構：3*3*128串聯3*3*128串聯maxpooling。

第三層結構：3*3*256串聯三次，再串聯maxpooling

第四層結構：3*3*512串聯三次，再串聯maxpooling

第五層結構：3*3*512串聯三次，再串聯maxpooling

最後：兩層FC全鏈接，利用softmax輸出。

VGG結構的主要特點：

1.用小的卷積核串聯替代大的卷積核：

例如用兩個3*3的卷積核串聯可以替代一個5*5的卷積核，用3個3*3的卷積核串聯可以替代一個7*7的卷積核。如圖所示，兩個串聯的3*3卷積核感受野和單獨的5*5卷積核完全一樣。

用小卷積核串聯的方法替代大卷積核有什麼優勢呢：

（1）增加了非線性函數，增強網絡的判別力。對於一個大的卷積核來說只有一個非線性激活函數，但是對於多個小卷積核的串聯，可以經過多個非線性激活函數。因此，模型能夠抽取得到更具有表達力的特徵。

（2）減少卷積參數。對於一個（C，H，W）的圖片，7*7的卷積核需要參數數量爲

2.遞增的通道數。

受到AlexNet的啓發，VGGNet採用了輸出的feature map通道遞增的方法，層數越深輸出通道數越多。這樣特徵維度越高，能夠獲得的特徵類型越豐富。

3.最後一層採用全卷積替換全連接。

使用1*1的卷積替代全連接網絡，這樣做可以接收任意寬高圖片作爲輸入。

4.實驗證明了LRN的無用

發佈了9 篇原創文章 · 獲贊 4 · 訪問量 1萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.