【圖像分類】更深的網絡VGGNet

1.VGGNet概述:

VGGNet在AlexNet基礎上創建了更深層的網絡,與GoogLeNet一起在2014年image net競賽中表現出色。VGGNet和GoogLeNet一起進一步提升了深度學習在圖像領域的表現。VGGNet證明了在一定程度上隨着網絡的加深,網絡的能力也有明顯的提高。

2.VGGNet網絡結構

VGGNet網絡中提供了多種網絡結構,A-E的網絡結構是基本一致的,最大的區別在於結構中卷積核的數量和大小不同,目前普遍使用的是D,E兩種結構,即爲人熟知的VGG16和VGG19。

以VGG16爲例:

input圖像輸入爲224*224*3

第一層結構:3*3*64串聯3*3*64串聯maxpooling。此層結構採用了3*3的卷積核進行串聯,這個串聯結構是VGG的首創,並且取得了非常不錯的結果。

第二層結構:3*3*128串聯3*3*128串聯maxpooling。

第三層結構:3*3*256串聯三次,再串聯maxpooling

第四層結構:3*3*512串聯三次,再串聯maxpooling

第五層結構:3*3*512串聯三次,再串聯maxpooling

最後:兩層FC全鏈接,利用softmax輸出。

 

VGG結構的主要特點:

1.用小的卷積核串聯替代大的卷積核:

例如用兩個3*3的卷積核串聯可以替代一個5*5的卷積核,用3個3*3的卷積核串聯可以替代一個7*7的卷積核。如圖所示,兩個串聯的3*3卷積核感受野和單獨的5*5卷積核完全一樣。

用小卷積核串聯的方法替代大卷積核有什麼優勢呢:

(1)增加了非線性函數,增強網絡的判別力。對於一個大的卷積核來說只有一個非線性激活函數,但是對於多個小卷積核的串聯,可以經過多個非線性激活函數。因此,模型能夠抽取得到更具有表達力的特徵。

(2)減少卷積參數。對於一個(C,H,W)的圖片,7*7的卷積核需要參數數量爲

2.遞增的通道數。

受到AlexNet的啓發,VGGNet採用了輸出的feature map通道遞增的方法,層數越深輸出通道數越多。這樣特徵維度越高,能夠獲得的特徵類型越豐富。

3.最後一層採用全卷積替換全連接。

使用1*1的卷積替代全連接網絡,這樣做可以接收任意寬高圖片作爲輸入。

4.實驗證明了LRN的無用

 

發佈了9 篇原創文章 · 獲贊 4 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章