异常侦测anomaly detection

2019spring李宏毅老师的机器学习课程 http://speech.ee.ntu.edu.tw/~tlkagk/courses.html

学习进度:

2019.3.29  :1、anomaly detection(异常侦测系统)的创建过程:

    2、评价Anomaly Detection系统好坏的方法:


1、anomaly detection(异常侦测系统)的创建过程:

  •  output最高的分数是信心分;
  • 判断distribution平不平均,算熵(entropy)比方差更合适;

如何建立一个anomaly detection ?

有一组训练集(Training Set)→Train a classifier →obtain confidence score   c(x)

→根据信心分,打造异常侦测系统:f(x)

→Dev Set(这里要有正常数据,和不正常数据),用Dev Set 来决定 λ 的值

→ 系统上线

 


  • 不能拿正确率来衡量Anomaly Detection 的好坏。(现实中如大气侦测等是很少有不正常数据的,可能几千万都是好数据)

   2、评价Anomaly Detection系统好坏的方法:

detected&Normal (右上角)这一格指  “正常的内容被判为异常”;→false

NotDet&Anomaly(左下角)这一格指 “异常的内容未被侦测出来”→ missing

最终,用cost table(扣分制)评价系统好坏;不同的情景不同任务有不同的cost table

(不同情境:检测图片是否匹配,往往采用上面的cost table A,即一个missing扣一分,一个false扣100分。

                    但如果是用于癌症的检测,会采用cost table B,missing的扣分比重需要很大,一个missing扣100分;

                    因为得了癌症但是未被检测出来的代价很大。但没得癌症被误诊为患病的代价没那么大)

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章