沒想到系列之YOLOv4:Optimal Speed and Accuracy of Object Detection

兩個月以前YOLO之父 Joseph Redmon發文稱不能忍受自己的研究被用於軍事等帶來的負面影響,放棄繼續推進YOLO的研究,羣裏師兄弟們都在爲之惋惜,這輩子看不到YOLOv4的出現了,但是沒想到昨天突然各大公衆號都開始瘋狂推送YOLOv4的消息,點開一看YOLOv4的作者確實不是 Joseph Redmon而是Alexey Bochkovskiy。

Alexey Bochkovskiy何許人也?在Windows上覆現過YOLOv3的朋友們肯定都對他不陌生,大名鼎鼎的darknetAB幫助大家在windows上順利復現出yolo的結果,沒想到YOLO之父 退役之後,這位俄羅斯的猛人接棒了YOLO,與 YOLOv3 相比,YOLOv4的 AP 和 FPS 分別提高了 10% 和 12%。且不談繼續推進YOLO的研究是否會帶來更多負面影響,單純從研究者角度來說,YOLOv4的問世無疑令人興奮不已!

YOLOv4論文鏈接:https://arxiv.org/abs/2004.10934

YOLOv4項目地址:https://github.com/AlexeyAB/darknet

論文abstract中,作者寫到,現在已經有很多方法能夠提升卷積神經網絡的性能,但是需要在大型的數據庫上對這些方法合理的組合並測試,並論證這些方法的有效性。某些特徵僅在某些模型上運行,並且僅限於特定的問題,或是只能在小型數據集上運行;而另外有些特徵(如批歸一化和殘差連接)則適用於大多數模型、任務和數據集。然後提出YOLOv4上採用了以下方法:WRC, CSP,CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss,然後通過一定的組合方式實現了SOTA結果, 在 MS COCO 數據集上獲得了 43.5% 的 AP 值 (65.7% AP50),在 Tesla V100 上實現了 ∼65 FPS 的實時速度。

  • 加權殘差連接(WRC)
  • Cross-Stage-Partial-connection,CSP
  • Cross mini-Batch Normalization,CmBN
  • 自對抗訓練(Self-adversarial-training,SAT)
  • Mish 激活(Mish-activation)
  • Mosaic 數據增強
  • DropBlock 正則化
  • CIoU 損失

初一看有點蒙,YOLOv4中到底整合了多少新東西進去,只能說大佬就是大佬,能沉住氣做實驗嘗試各種能提升性能的方法,還有組合方式。

作者對比了 YOLOv4 和當前最優目標檢測器,發現 YOLOv4 在取得與 EfficientDet 同等性能的情況下,速度是 EfficientDet 的二倍!與 YOLOv3 相比,YOLOv4的 AP 和 FPS 分別提高了 10% 和 12%。

YOLOv4的貢獻在於:

  1. 建立了一個高效強大的目標檢測模型。它使得每個人都可以使用 1080Ti 或 2080Ti 的 GPU 來訓練一個快速準確的目標檢測器。

  2. 驗證了當前最優 Bag-of-Freebies 和 Bag-of-Specials 目標檢測方法在檢測器訓練過程中的影響。

  3. 修改了 SOTA 方法,使之更加高效,更適合單 GPU 訓練。這些方法包括 CBN、PAN、SAM 等。

後面具體採用了一些什麼方法還需要仔細的閱讀論文,令我比較感興趣的是YOLOv4中加入了注意機制

將 SAM 從空間注意力機制(spatial-wise attention)修改爲點注意力機制(point-wise attention),並將 PAN 中的捷徑連接替換爲級聯

最終實驗結果AP和AP50,從圖上可以看出,YOLOv4是目前最好的目標檢測器

後面有時間復現一下YOLOv4,感受一下最新的研究成果!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章