1.目标检测的基本任务
目标检测是计算机视觉的一个基本方向。其基本任务就是从一张图片里找到一些物体,判断这些物体是什么,并且尽可能好的把这个物体用一个矩形框给框起来。
其中确定物体是什么就是一个分类任务
而对边界框进行确定就需要回归任务
如何知道一个矩形框的具体位置呢,要么你知道左上角的顶点座标,然后还知道矩形的宽和高。要么你知道左上角和右下角两个对角顶点的座标。
基本的任务很清楚,但是实操起来会遇到几个基本的问题:
- 图像中的目标个数不确定,比如上图有好几个人,那也可能人更多,也可能一个也没有。我们事先是不知道有几个目标,每个目标有几个的。
- 矩形框的位置到底怎么求才最好。
2.目标检测发展历程简述
在神经网络火之前,也有传统的目标检测算法。比如滑动窗口,但是这种算法处理起来慢,而且性能并不是十分的好。
后来,神经网络被用于目标检测,逐渐有了R-CNN,Fast R-CNN,Faster R-CNN, Mask R-CNN,Yolo,SSD等等算法。
这些算法大致分为两类:
- two-stage :先生成候选框,然后再对候选框进行分类和回归,如:各种R-CNN。优点是准确度高,缺点是慢。
- one-stage:直接预测目标的种类和位置。如Yolo,SSD。优点是快,缺点是准确度不够高。