SPP Layer
SPP layer 是Kaiming He組在ECCV2014年的《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》這篇文章中提出的一種空間結構下采樣方法。
Caffe把該網絡層結構加進來自己的平臺中。下面我介紹下SPP結構的內容:
message SPPParameter {
enum PoolMethod {
MAX = 0;
AVE = 1;
STOCHASTIC = 2;
} //caffe提供了3種下採樣方法,分別是最大值,均值和隨機下采樣
optional uint32 pyramid_height = 1; // 設置金字塔結構高度
optional PoolMethod pool = 2 [default = MAX]; // 下采樣方法,默認爲MAX
enum Engine {
DEFAULT = 0;
CAFFE = 1;
CUDNN = 2;
} // caffe對特殊層提供多個引擎,有三種,一種是默認,第二種是caffe實現,最後是用cudnn加速引擎
optional Engine engine = 6 [default = DEFAULT];
}
SPP對於任意大小的特徵圖,空間金字塔下采樣得到的特徵維度是固定的。M維特徵只跟空間金字塔的level數有關。最後得到的特徵是前一層的濾波器個數k乘上M維。即kM-dimensions feature map
.