2019spring李宏毅老师的机器学习课程 http://speech.ee.ntu.edu.tw/~tlkagk/courses.html
学习进度:
2019.3.29 :1、anomaly detection(异常侦测系统)的创建过程:
1、anomaly detection(异常侦测系统)的创建过程:
- output最高的分数是信心分;
- 判断distribution平不平均,算熵(entropy)比方差更合适;
如何建立一个anomaly detection ?
有一组训练集(Training Set)→Train a classifier →obtain confidence score c(x)
→根据信心分,打造异常侦测系统:f(x)
→Dev Set(这里要有正常数据,和不正常数据),用Dev Set 来决定 λ 的值
→ 系统上线
- 不能拿正确率来衡量Anomaly Detection 的好坏。(现实中如大气侦测等是很少有不正常数据的,可能几千万都是好数据)
2、评价Anomaly Detection系统好坏的方法:
detected&Normal (右上角)这一格指 “正常的内容被判为异常”;→false
NotDet&Anomaly(左下角)这一格指 “异常的内容未被侦测出来”→ missing
最终,用cost table(扣分制)评价系统好坏;不同的情景不同任务有不同的cost table
(不同情境:检测图片是否匹配,往往采用上面的cost table A,即一个missing扣一分,一个false扣100分。
但如果是用于癌症的检测,会采用cost table B,missing的扣分比重需要很大,一个missing扣100分;
因为得了癌症但是未被检测出来的代价很大。但没得癌症被误诊为患病的代价没那么大)