YOLOv3的簡介
YOLOv3總結了自己在YOLOv2的基礎上做的一些嘗試性改進,有的嘗試取得了成功,而有的嘗試並沒有提升模型性能。其中有兩個值得一提的亮點,一個是使用殘差模型,進一步加深了網絡結構;另一個是使用FPN架構實現多尺度檢測。
YOLOv3的創新點
- 新的網絡結構:DarkNet-53
- 融合FPN
- 用邏輯迴歸替代softmax作爲分類器
YOLOv3對網絡做的改進
YOLOv3在之前DarkNet-19的基礎上引入了殘差快,並進一步加深了網絡,改進後的網絡有53個卷積層,取名爲DarkNet-53,網絡結構如下圖所示:
爲了比較DarkNet-53與其它網絡結構的性能,作者在TitanX上,採用相同的實驗設置,將的圖片分別輸入以DarkNet-19,ResNet-101,ResNet-152和DarkNet-53爲基礎網絡的分類模型中,實驗得到的結果如下圖所示。
可以看到DarkNet-53比ResNet-101的性能更好,而且速度是其1.5倍,DarkNet-53與ResNet-152性能相似但速度幾乎是其2倍。注意到,DarkNet-53相比於其它網絡結構實現了每秒最高的浮點計算量,說明其網絡結構能更好的利用GPU。
YOLOv3實現多尺度檢測
YOLOv3借鑑了FPN的思想,從不同尺度提取特徵。相比YOLOv2,YOLOv3提取最後3層特徵圖,不僅在每個特徵圖上分別獨立做預測,同時通過將小特徵圖上採樣到與大的特徵圖相同大小,然後與大的特徵圖拼接做進一步預測。用維度聚類的思想聚類出9種尺度的anchor box,將9種尺度的anchor box均勻的分配給3種尺度的特徵圖。如下圖是在網絡結構圖的基礎上加上多尺度特徵提取部分的示意圖: