深度學習_目標檢測_YOLOv3論文詳解

YOLOv3的簡介

YOLOv3總結了自己在YOLOv2的基礎上做的一些嘗試性改進,有的嘗試取得了成功,而有的嘗試並沒有提升模型性能。其中有兩個值得一提的亮點,一個是使用殘差模型,進一步加深了網絡結構;另一個是使用FPN架構實現多尺度檢測。

YOLOv3的創新點

  1. 新的網絡結構:DarkNet-53
  2. 融合FPN
  3. 用邏輯迴歸替代softmax作爲分類器

YOLOv3對網絡做的改進

YOLOv3在之前DarkNet-19的基礎上引入了殘差快,並進一步加深了網絡,改進後的網絡有53個卷積層,取名爲DarkNet-53,網絡結構如下圖所示:

在這裏插入圖片描述

爲了比較DarkNet-53與其它網絡結構的性能,作者在TitanX上,採用相同的實驗設置,將256×256256\times 256的圖片分別輸入以DarkNet-19,ResNet-101,ResNet-152和DarkNet-53爲基礎網絡的分類模型中,實驗得到的結果如下圖所示。

在這裏插入圖片描述

可以看到DarkNet-53比ResNet-101的性能更好,而且速度是其1.5倍,DarkNet-53與ResNet-152性能相似但速度幾乎是其2倍。注意到,DarkNet-53相比於其它網絡結構實現了每秒最高的浮點計算量,說明其網絡結構能更好的利用GPU。

YOLOv3實現多尺度檢測

YOLOv3借鑑了FPN的思想,從不同尺度提取特徵。相比YOLOv2,YOLOv3提取最後3層特徵圖,不僅在每個特徵圖上分別獨立做預測,同時通過將小特徵圖上採樣到與大的特徵圖相同大小,然後與大的特徵圖拼接做進一步預測。用維度聚類的思想聚類出9種尺度的anchor box,將9種尺度的anchor box均勻的分配給3種尺度的特徵圖。如下圖是在網絡結構圖的基礎上加上多尺度特徵提取部分的示意圖:

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章