沒想到系列之YOLOv4：Optimal Speed and Accuracy of Object Detection

原創

2020-04-25 20:15

兩個月以前YOLO之父 Joseph Redmon發文稱不能忍受自己的研究被用於軍事等帶來的負面影響，放棄繼續推進YOLO的研究，羣裏師兄弟們都在爲之惋惜，這輩子看不到YOLOv4的出現了，但是沒想到昨天突然各大公衆號都開始瘋狂推送YOLOv4的消息，點開一看YOLOv4的作者確實不是 Joseph Redmon而是Alexey Bochkovskiy。

Alexey Bochkovskiy何許人也？在Windows上覆現過YOLOv3的朋友們肯定都對他不陌生，大名鼎鼎的darknetAB幫助大家在windows上順利復現出yolo的結果，沒想到YOLO之父退役之後，這位俄羅斯的猛人接棒了YOLO，與 YOLOv3 相比，YOLOv4的 AP 和 FPS 分別提高了 10% 和 12%。且不談繼續推進YOLO的研究是否會帶來更多負面影響，單純從研究者角度來說，YOLOv4的問世無疑令人興奮不已！

YOLOv4論文鏈接：https://arxiv.org/abs/2004.10934

YOLOv4項目地址：https://github.com/AlexeyAB/darknet

論文abstract中，作者寫到，現在已經有很多方法能夠提升卷積神經網絡的性能，但是需要在大型的數據庫上對這些方法合理的組合並測試，並論證這些方法的有效性。某些特徵僅在某些模型上運行，並且僅限於特定的問題，或是只能在小型數據集上運行；而另外有些特徵（如批歸一化和殘差連接）則適用於大多數模型、任務和數據集。然後提出YOLOv4上採用了以下方法：WRC, CSP,CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss，然後通過一定的組合方式實現了SOTA結果，在 MS COCO 數據集上獲得了 43.5% 的 AP 值 (65.7% AP50)，在 Tesla V100 上實現了 ∼65 FPS 的實時速度。

加權殘差連接（WRC）
Cross-Stage-Partial-connection，CSP
Cross mini-Batch Normalization，CmBN
自對抗訓練（Self-adversarial-training，SAT）
Mish 激活（Mish-activation）
Mosaic 數據增強
DropBlock 正則化
CIoU 損失

初一看有點蒙，YOLOv4中到底整合了多少新東西進去，只能說大佬就是大佬，能沉住氣做實驗嘗試各種能提升性能的方法，還有組合方式。

作者對比了 YOLOv4 和當前最優目標檢測器，發現 YOLOv4 在取得與 EfficientDet 同等性能的情況下，速度是 EfficientDet 的二倍！與 YOLOv3 相比，YOLOv4的 AP 和 FPS 分別提高了 10% 和 12%。

YOLOv4的貢獻在於：

建立了一個高效強大的目標檢測模型。它使得每個人都可以使用 1080Ti 或 2080Ti 的 GPU 來訓練一個快速準確的目標檢測器。
驗證了當前最優 Bag-of-Freebies 和 Bag-of-Specials 目標檢測方法在檢測器訓練過程中的影響。
修改了 SOTA 方法，使之更加高效，更適合單 GPU 訓練。這些方法包括 CBN、PAN、SAM 等。

後面具體採用了一些什麼方法還需要仔細的閱讀論文，令我比較感興趣的是YOLOv4中加入了注意機制

將 SAM 從空間注意力機制（spatial-wise attention）修改爲點注意力機制（point-wise attention），並將 PAN 中的捷徑連接替換爲級聯

最終實驗結果AP和AP50，從圖上可以看出，YOLOv4是目前最好的目標檢測器

後面有時間復現一下YOLOv4，感受一下最新的研究成果！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

沒想到系列之YOLOv4：Optimal Speed and Accuracy of Object Detection

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

.NET週刊【5月第2期 2024-05-12】

根據域名查詢服務器的ip地址

Python讀取保存txt、csv、json文件方法

阿里雲服務器實現frp內網穿透（完整教程）

Tensorflow2.0學習筆記------模型保存和加載

Win10下手把手教你Mask RCNN繪製PR曲線、計算mAP

Tensorflow2.0學習筆記------構建高級模型

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結