異常偵測anomaly detection

2019spring李宏毅老師的機器學習課程 http://speech.ee.ntu.edu.tw/~tlkagk/courses.html

學習進度:

2019.3.29  :1、anomaly detection(異常偵測系統)的創建過程:

    2、評價Anomaly Detection系統好壞的方法:


1、anomaly detection(異常偵測系統)的創建過程:

  •  output最高的分數是信心分;
  • 判斷distribution平不平均,算熵(entropy)比方差更合適;

如何建立一個anomaly detection ?

有一組訓練集(Training Set)→Train a classifier →obtain confidence score   c(x)

→根據信心分,打造異常偵測系統:f(x)

→Dev Set(這裏要有正常數據,和不正常數據),用Dev Set 來決定 λ 的值

→ 系統上線

 


  • 不能拿正確率來衡量Anomaly Detection 的好壞。(現實中如大氣偵測等是很少有不正常數據的,可能幾千萬都是好數據)

   2、評價Anomaly Detection系統好壞的方法:

detected&Normal (右上角)這一格指  “正常的內容被判爲異常”;→false

NotDet&Anomaly(左下角)這一格指 “異常的內容未被偵測出來”→ missing

最終,用cost table(扣分制)評價系統好壞;不同的情景不同任務有不同的cost table

(不同情境:檢測圖片是否匹配,往往採用上面的cost table A,即一個missing扣一分,一個false扣100分。

                    但如果是用於癌症的檢測,會採用cost table B,missing的扣分比重需要很大,一個missing扣100分;

                    因爲得了癌症但是未被檢測出來的代價很大。但沒得癌症被誤診爲患病的代價沒那麼大)

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章