没想到系列之YOLOv4：Optimal Speed and Accuracy of Object Detection

原創

2020-04-25 20:15

两个月以前YOLO之父 Joseph Redmon发文称不能忍受自己的研究被用于军事等带来的负面影响，放弃继续推进YOLO的研究，群里师兄弟们都在为之惋惜，这辈子看不到YOLOv4的出现了，但是没想到昨天突然各大公众号都开始疯狂推送YOLOv4的消息，点开一看YOLOv4的作者确实不是 Joseph Redmon而是Alexey Bochkovskiy。

Alexey Bochkovskiy何许人也？在Windows上覆现过YOLOv3的朋友们肯定都对他不陌生，大名鼎鼎的darknetAB帮助大家在windows上顺利复现出yolo的结果，没想到YOLO之父退役之后，这位俄罗斯的猛人接棒了YOLO，与 YOLOv3 相比，YOLOv4的 AP 和 FPS 分别提高了 10% 和 12%。且不谈继续推进YOLO的研究是否会带来更多负面影响，单纯从研究者角度来说，YOLOv4的问世无疑令人兴奋不已！

YOLOv4论文链接：https://arxiv.org/abs/2004.10934

YOLOv4项目地址：https://github.com/AlexeyAB/darknet

论文abstract中，作者写到，现在已经有很多方法能够提升卷积神经网络的性能，但是需要在大型的数据库上对这些方法合理的组合并测试，并论证这些方法的有效性。某些特征仅在某些模型上运行，并且仅限于特定的问题，或是只能在小型数据集上运行；而另外有些特征（如批归一化和残差连接）则适用于大多数模型、任务和数据集。然后提出YOLOv4上采用了以下方法：WRC, CSP,CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss，然后通过一定的组合方式实现了SOTA结果，在 MS COCO 数据集上获得了 43.5% 的 AP 值 (65.7% AP50)，在 Tesla V100 上实现了 ∼65 FPS 的实时速度。

加权残差连接（WRC）
Cross-Stage-Partial-connection，CSP
Cross mini-Batch Normalization，CmBN
自对抗训练（Self-adversarial-training，SAT）
Mish 激活（Mish-activation）
Mosaic 数据增强
DropBlock 正则化
CIoU 损失

初一看有点蒙，YOLOv4中到底整合了多少新东西进去，只能说大佬就是大佬，能沉住气做实验尝试各种能提升性能的方法，还有组合方式。

作者对比了 YOLOv4 和当前最优目标检测器，发现 YOLOv4 在取得与 EfficientDet 同等性能的情况下，速度是 EfficientDet 的二倍！与 YOLOv3 相比，YOLOv4的 AP 和 FPS 分别提高了 10% 和 12%。

YOLOv4的贡献在于：

建立了一个高效强大的目标检测模型。它使得每个人都可以使用 1080Ti 或 2080Ti 的 GPU 来训练一个快速准确的目标检测器。
验证了当前最优 Bag-of-Freebies 和 Bag-of-Specials 目标检测方法在检测器训练过程中的影响。
修改了 SOTA 方法，使之更加高效，更适合单 GPU 训练。这些方法包括 CBN、PAN、SAM 等。

后面具体采用了一些什么方法还需要仔细的阅读论文，令我比较感兴趣的是YOLOv4中加入了注意机制

将 SAM 从空间注意力机制（spatial-wise attention）修改为点注意力机制（point-wise attention），并将 PAN 中的捷径连接替换为级联

最终实验结果AP和AP50，从图上可以看出，YOLOv4是目前最好的目标检测器

后面有时间复现一下YOLOv4，感受一下最新的研究成果！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

没想到系列之YOLOv4：Optimal Speed and Accuracy of Object Detection

杭州的 IT 崩盘了么？

开源高性能结构化日志模块NanoLog

Python 潮流周刊#55：分享 9 个高质量的技术类信息源！

Azure Virtual Network (22) 多订阅使用Azure DNS解析问题 Windows Azure Platform 系列文章目录

【简写Mybatis-02】注册机的实现以及SqlSession处理

手绘二维码

.NET借助虚拟网卡实现一个简单异地组网工具

Python讀取保存txt、csv、json文件方法

阿里雲服務器實現frp內網穿透（完整教程）

Tensorflow2.0學習筆記------模型保存和加載

Win10下手把手教你Mask RCNN繪製PR曲線、計算mAP

Tensorflow2.0學習筆記------構建高級模型

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結