YOLO系列(二)—— YOLO9000:Better, Faster, Stronger

本系列分爲三篇,此文爲本系列第二篇,其他文章:
YOLO系列(一)—— You Only Look Once:Unified, Real-Time Object Detection
YOLO系列(三)—— YOLOv3: An Incremental Improvement

project: https://pjreddie.com/darknet/yolo/
paper: YOLO9000:Better, Faster, Stronger
yolo v2在yolo的基礎上做了一些改進,對yolo不熟悉的可以參考:YOLO系列(一)

在paper中,並沒有給出網絡結構的完整示意圖,下圖是在網上找的,原網址查看更加清晰:https://ethereon.github.io/netscope/#/gist/d08a41711e48cf111e330827b1279c31
在這裏插入圖片描述

相對yolo做出的修改:
1)去掉全連接層,採用全卷積結構,可以輸入不同的尺寸結構(32的倍數即可,下採樣率爲32)
2)在每個卷積層中加入Batch Normalization,去掉dropout
3)開始訓練時就採用448×448的高分辨率進行訓練
4)使用了Anchor Boxes,每個grid預測5個boxes,一共可以預測13×13×5=845個boxes,且每個box都有對應的class,遠多於yolo的98個boxes,以及每個grid一個class
5)Anchor Boxes由聚類生成,評價標準爲IOU
6)使用多尺度特徵,將兩層前的feature reorganization後和當前層進行concate
7) box的預測在之前的基於Anchor的方式上做了一定修改,如下圖所示
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章