【1】目标检测简述

1.目标检测的基本任务

目标检测是计算机视觉的一个基本方向。其基本任务就是从一张图片里找到一些物体,判断这些物体是什么,并且尽可能好的把这个物体用一个矩形框给框起来。
其中确定物体是什么就是一个分类任务
而对边界框进行确定就需要回归任务

在这里插入图片描述
在这里插入图片描述
如何知道一个矩形框的具体位置呢,要么你知道左上角的顶点座标,然后还知道矩形的宽和高。要么你知道左上角和右下角两个对角顶点的座标

基本的任务很清楚,但是实操起来会遇到几个基本的问题:

  • 图像中的目标个数不确定,比如上图有好几个人,那也可能人更多,也可能一个也没有。我们事先是不知道有几个目标,每个目标有几个的。
  • 矩形框的位置到底怎么求才最好。

2.目标检测发展历程简述

在神经网络火之前,也有传统的目标检测算法。比如滑动窗口,但是这种算法处理起来慢,而且性能并不是十分的好。

后来,神经网络被用于目标检测,逐渐有了R-CNN,Fast R-CNN,Faster R-CNN, Mask R-CNN,Yolo,SSD等等算法。

这些算法大致分为两类:

  • two-stage :先生成候选框,然后再对候选框进行分类和回归,如:各种R-CNN。优点是准确度高,缺点是慢。
  • one-stage:直接预测目标的种类和位置。如Yolo,SSD。优点是快,缺点是准确度不够高。

3.目标检测常用算法对比

在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章