textboxes 網絡結構詳解

1、SSD網絡結構

image.png

Caffe代碼 .prototxt中 :

SSD的結構爲conv1_1,conv1_2,conv2_1,conv2_2,conv3_1,conv3_2,conv3_3,conv4_1,conv4_2,conv4_3,conv5_1,conv5_2,conv5_3(512),(注意這是:textbox++ 中 13 are inherited from VGG-16.)

fc6:3×3×1024的卷積(原來VGG16中的fc6是全連接層,這裏變成卷積層,下面的fc7層同理),fc7:1×1×1024的卷積,conv6_1,conv6_2(對應上圖的conv8_2),conv7_1,conv7_2,conv8_1,conv8_2,conv9_1,conv9_2,loss。
(注意:由於 fc6、fc7的原因 ,conv6_1到conv9_2 對應到上圖的conv8_1 到conv11_2)

image.png

然後針對.prototxt中的 conv4_3(4),fc7(6),conv6_2(6 ),conv7_2(6),conv8_2(4),conv9_2(4)的每一個再分別採用兩個3*3大小的卷積核進行卷積,這兩個卷積核是並列的。
注意這也是:textbox++ 中6層 textbox layers.

2、textboxes 中 網絡結構

image.png

這是一個28層的全卷積網絡。額外的9個卷積層添加在VGG-16層之後(不是 1 中conv6_1到con9_1 共8個卷積層嗎?),Text-box層連接着6個卷積層(同1中)。在每一個特徵位置,一個text-box預測72維向量,這是文本出現的得分(text presencescores)(2維)和12個default box的偏移(4個offsets)。一個非最大抑制(NMS)用來聚合所有文本盒子(text-boxlayers)層的輸出

2.1、關於12個default box

ssd的defaultbox

image.png

感謝:

ssd詳解

textbox詳解

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章