定义
模式识别 & 信息检索领域中的二分类问题中,一个分类器的计算效果可以通过如下两个指标进行衡量:
- Precision:识别样本中,相关的样本比例;
- Recall:相关样本中,识别的样本比例;
二者关系如下图所示:
如:在9只Dog和若干Cat构成的集合中,一个分类器识别出了7只Dog;其中4只识别正确,另外3只为Cat;此时:
Precision = 4/7
Recall = 4/9
Type I & Type II Error
如果将零假设定义为: 分类器识别了所有,且仅相关样本; 那么precision & recall 分别对应于第I类和第II类错误;上例中包含了3个第I类错误和5个第二类错误;