YOLO系列(三)—— YOLOv3: An Incremental Improvement

本系列分爲三篇,此文爲本系列第三篇,其他文章:
YOLO系列(一)—— You Only Look Once:Unified, Real-Time Object Detection
YOLO系列(二)—— YOLO9000:Better, Faster, Stronger

project: https://pjreddie.com/darknet/yolo/
paper: YOLOv3: An Incremental Improvement

YOLOv3沒有太大的創新,主要是借鑑一些現有的方法來對YOLOv2進行一些改進,不過效果還是比較好的,在延續自己速度優勢的情況下,提升了檢測的準確率,效果如下圖所示:
在這裏插入圖片描述

YOLOv3主要在以下幾個方面做了改進:
1)對象分類由softmax改成logistic,這樣可以適用於一個物體有多個標籤的情況
2)借鑑FPN,在3個不同特徵尺度上進行預測,每個尺度每個grid預測3個boxes。
以416×416的輸入爲例,預測的box數爲:
大box: 416/32=13 13×13×3=507
中box: 13×2=26 26×26×3=2028
小box: 26×2=52 52×52×3=8112
這樣大大提升了對小物體的檢測
3)修改網絡結構爲Darknet-53
主要是借鑑了residual network加入了shortcut connections,具體結構如下圖所示:
在這裏插入圖片描述

如果採用COCO mAP50做評估指標,YOLOv3的表現效果更好,如下圖所示:
在這裏插入圖片描述

因此在對預測框準確度要求不是特別高的場合,YOLOv3特別適用,也說明了其box的IOU還有待加強。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章