没想到系列之YOLOv4:Optimal Speed and Accuracy of Object Detection

两个月以前YOLO之父 Joseph Redmon发文称不能忍受自己的研究被用于军事等带来的负面影响,放弃继续推进YOLO的研究,群里师兄弟们都在为之惋惜,这辈子看不到YOLOv4的出现了,但是没想到昨天突然各大公众号都开始疯狂推送YOLOv4的消息,点开一看YOLOv4的作者确实不是 Joseph Redmon而是Alexey Bochkovskiy。

Alexey Bochkovskiy何许人也?在Windows上覆现过YOLOv3的朋友们肯定都对他不陌生,大名鼎鼎的darknetAB帮助大家在windows上顺利复现出yolo的结果,没想到YOLO之父 退役之后,这位俄罗斯的猛人接棒了YOLO,与 YOLOv3 相比,YOLOv4的 AP 和 FPS 分别提高了 10% 和 12%。且不谈继续推进YOLO的研究是否会带来更多负面影响,单纯从研究者角度来说,YOLOv4的问世无疑令人兴奋不已!

YOLOv4论文链接:https://arxiv.org/abs/2004.10934

YOLOv4项目地址:https://github.com/AlexeyAB/darknet

论文abstract中,作者写到,现在已经有很多方法能够提升卷积神经网络的性能,但是需要在大型的数据库上对这些方法合理的组合并测试,并论证这些方法的有效性。某些特征仅在某些模型上运行,并且仅限于特定的问题,或是只能在小型数据集上运行;而另外有些特征(如批归一化和残差连接)则适用于大多数模型、任务和数据集。然后提出YOLOv4上采用了以下方法:WRC, CSP,CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss,然后通过一定的组合方式实现了SOTA结果, 在 MS COCO 数据集上获得了 43.5% 的 AP 值 (65.7% AP50),在 Tesla V100 上实现了 ∼65 FPS 的实时速度。

  • 加权残差连接(WRC)
  • Cross-Stage-Partial-connection,CSP
  • Cross mini-Batch Normalization,CmBN
  • 自对抗训练(Self-adversarial-training,SAT)
  • Mish 激活(Mish-activation)
  • Mosaic 数据增强
  • DropBlock 正则化
  • CIoU 损失

初一看有点蒙,YOLOv4中到底整合了多少新东西进去,只能说大佬就是大佬,能沉住气做实验尝试各种能提升性能的方法,还有组合方式。

作者对比了 YOLOv4 和当前最优目标检测器,发现 YOLOv4 在取得与 EfficientDet 同等性能的情况下,速度是 EfficientDet 的二倍!与 YOLOv3 相比,YOLOv4的 AP 和 FPS 分别提高了 10% 和 12%。

YOLOv4的贡献在于:

  1. 建立了一个高效强大的目标检测模型。它使得每个人都可以使用 1080Ti 或 2080Ti 的 GPU 来训练一个快速准确的目标检测器。

  2. 验证了当前最优 Bag-of-Freebies 和 Bag-of-Specials 目标检测方法在检测器训练过程中的影响。

  3. 修改了 SOTA 方法,使之更加高效,更适合单 GPU 训练。这些方法包括 CBN、PAN、SAM 等。

后面具体采用了一些什么方法还需要仔细的阅读论文,令我比较感兴趣的是YOLOv4中加入了注意机制

将 SAM 从空间注意力机制(spatial-wise attention)修改为点注意力机制(point-wise attention),并将 PAN 中的捷径连接替换为级联

最终实验结果AP和AP50,从图上可以看出,YOLOv4是目前最好的目标检测器

后面有时间复现一下YOLOv4,感受一下最新的研究成果!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章