MAP学习记录

主要参考https://github.com/rafaelpadilla/Object-Detection-Metrics

名词解释

预测结果分为4个类:

TP:你的预测正确的预测了目标

FP:你的预测错误的预测了目标

FN:有一个目标你没检测到

TN:你正确的对非目标,也即是背景做出预测,一般这一项忽略

名词解释:

precision描述了你的所有的预测的正确率是多少。比如说你做出了100个预测,97个是正确的,那么就是0.97.

recall描述了检测率,即是图片中一共有多少目标,你检测到了多少。比如图片一共10个目标,你检测到7个,那么recal就是0.7。

AP的意识就是,固定一个iou阈值,变化confidence阈值,得到曲线,然后计算曲线与recall轴的面积。其意义其实就是算个平均值,不同confidengce阈值下precision的平均值。

为什么平均值是面积?比如你粗略计算一个曲线在某一区间的均值,就是随便取几个点,相加然后平均,而将随便取的几个点的数量趋于无穷,那么此时的求平均公式可以转换成定积分公式,而定积分就是求面积,因此就是面积。

AP0.5是指将iou的threshold定为0.5时的AP。

 

各个参数的关系

无论哪个目标检测模型,都会输出boxes和boxes是否是目标的预测值,这个在参考文献中叫confidence。而一般来说,一副图片的输出结果会有成千上万个box,一般来说这些box的confidence都很小,因为图片中的背景占的比例多。

而在处理box时,会给定一个阈值,如0.4,所有confidence小于0.4的都认为是背景。且一般来说confidence越大,盒子的数量就越少,反之盒子的数量多recall大、而precision小。因此是confidence变,而判断预测对不对还要用到iou,比如预测的框和目标的框大于0.5就算预测正确,一般画那个曲线,iou是不变的,变的是confidence。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章