YOLOv4來了!COCO 43.5 AP,65FPS!實現速度與精度的最優平衡

今年初 YOLO 之父Joseph Redmon宣佈推出CV界,引起軒然大波,大家紛紛猜測YOLO是否不會再出v4版,退出歷史舞臺。

今天,YOLOv4重磅發佈,作者爲俄羅斯開發者 Alexey Bochkovskiy 和兩位中國臺灣開發者 Chien-Yao Wang、Hong-Yuan Mark Liao。

 

YOLOv4 沒有理論創新,而是在原有YOLO目標檢測架構的基礎上增加了近年CNN改進的衆多技術

數據處理網絡訓練再到損失函數遵行“拿來主義”,加上漂亮的工程實踐打造實現最佳速度與精度平衡的目標檢測新基準!

在MS COCO 數據集 實現 43.5% AP(平均精準度) (65.7% AP50 ), 速度也更快了,在Tesla V100 GPU上 ∼65 FPS!

FPS :每秒幀率 Frame Per Second

AP:average precision 平均精準度

上圖爲YOLOv4與其他SOTA目標檢測算法的比較,在精度差不多的情況下YOLOv4比EfficientDet快兩倍,而相對於YOLOv3 AP和FPS 分別提升了10%和12%!

1.目標檢測模型架構

作者首先對現有目標檢測方法進行了總結,無論是one-stage 、two-stage 還是 anchor free 、anchor based,均包含 Input、Backbone 、Neck、Heads(Dense Prediction或者Sparse Prediction)四部分。

目前各部分的主流技術包括:

 

然後作者對現有目標檢測相關技術的進展做了總結,即大禮包“bag of freebies”和特價袋“Bag of specials”。

  • bag of freebies 大禮包 指那些能夠提高精度而不增加推斷時間的技術。比如數據增廣的方法圖像幾何變換、CutOut、grid mask等,網絡正則化的方法DropOut、DropBlock等,類別不平衡的處理方法、難例挖掘方法、損失函數的設計等。

  • bag of specials 特價貸 是指那些增加稍許推斷代價,但可以提高模型精度的方法,比如增大模型感受野的SPP、ASPP、RFB等,引入注意力機制Squeeze-and-Excitation (SE) 、Spatial Attention Module (SAM)等 ,特徵集成方法SFAM , ASFF ,  BiFPN等,改進的激活函數Swish、Mish等,或者是後處理方法如soft NMS、DIoU NMS等

02 YOLOv4方法介紹

架構選擇:

經過綜合考慮計算量和精度,作者最終選擇的架構是:CSPDarknet53 作爲 backbone, SPP 模塊用於增大感受野, PANet 用作 neck, 並仍沿襲 YOLOv3(anchor based) head。

最終 YOLOv4實用的技術:

YOLOv4包括
Backbone:CSPDarknet53 [81]
Neck:SPP [25],PAN [49]
Head:YOLOv3 [63]
YOLO v4 使用:
主幹網絡的大禮包(BOF):Cutmix和Mosaic數據增強,Dropblock正則化類標籤平滑
主幹網絡的特價袋(Bos):誤操作跨階段部分連接(CSP)、多重剩餘連接(MIWRC)
探測器的免費包(BOF):Clou lossCMBN,Dropblock正則化,馬賽克數據增強,自我對抗訓練,消除網格敏感度,使用多個錨用於單個地面真值,餘弦退火調度器[52],最優超參數,隨機訓練形狀
探測器專用包(Bos):誤激活PP塊、山姆塊、泛路徑聚合塊、DIOU-NMS

03 實驗結果

作者在MS COCO 數據集上進行了實驗,結果如下:

每一行分別代表不同的GPU計算結果:

 

  • 在主流的SOTA目標檢測算法中,YOLOv4實現了最佳的速度和精度的平衡,

  • 在精度差不多的情況下,YOLOv4的速度往往是最快的,

  • 尤其在FPS超過30的實時算法中,YOLOv4是精度最高的。

 

因爲不同的算法公佈時可能在不同的GPU上進行測試,作者根據不同的GPU(Maxwell/Pascal/Volta)分別列出了YOLOv4與其他算法的更詳細的比較,即Table 8、9、10,幀率大於等於30的用藍底標出。

可見YOLOv4 在實時目標檢測算法中精度最高,實現了精度和速度的最佳平衡。

04 傳送門

論文地址:

https://arxiv.org/pdf/2004.10934v1.pdf

 

 

 

開源地址:

https://github.com/AlexeyAB/darknet

不僅有代碼、模型而且提供了詳細的訓練和測試方法。

(在OpenCV中文網公衆號後臺回覆“YOLOv4”,即可收到論文下載)

雖然YOLOv4在理論上沒有創新,但其引人注目的精度速度,承襲YOLO系列的簡單易上手的操作體驗,必將成爲實時目標檢測的口碑之作!

終於有人扛起了YOLO的大旗了!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章