paper:Deep Learning Strong Parts for Pedestrian Detection
目錄
主要解決的問題
做行人檢測時,將CNN的主要特徵轉移給了行人,但無法做遮擋處理。
提出的解決辦法
以前只是建立一個單一的檢測器,本文提出了DeepParts,有以下3個特性:
- 可以訓練弱標籤數據
- 可以處理偏移標準的低IoU positive proposals
- 每個監測器都足夠檢測一部分
1、現階段對於阻塞問題的處理方法
- 爲不同阻塞類型訓練不同的監測器
- 將部分可見變量建模爲潛在變量
2、文章創新點
- 通過數據驅動,自動選擇若干局部互補模型
- 首次探索基於ConvNets,將單一部件檢測器及其組合用於行人檢測
- 提出一個新的方法用以處理偏移問題
- Caltech數據集中,missing rate降低到了11.89%
3、訓練部分池過程
- 構建part pool
- 對每一個part訓練一個檢測器patch,針對proposal windows偏移問題提出解決方法。三個深模型:AlexNet、Clarifai、GoogleLeNet。三個預訓練策略: 無預訓練,參數高斯分佈隨機初始化;ImageNet預訓練;ImageNet中對象塊的預訓練。
- 綜合各個檢測器,得到行人檢測結果
4、深模型中的移位處理
- Shifting造成IoU低
- 提出的解決方案爲jitter
- Jitter中的testing time會增加k次(k爲patch數)
- 引入全卷積模型
5、學習過程
- 輸入圖像
- 選擇part pool部分
- 提取CNN特徵
- 利用線性SVM對CNN特徵分類
- 完成行人檢測
6、遺留問題
使用了多個模型,如何做模型間的壓縮