2019spring李宏毅老師的機器學習課程 http://speech.ee.ntu.edu.tw/~tlkagk/courses.html
學習進度:
2019.3.29 :1、anomaly detection(異常偵測系統)的創建過程:
1、anomaly detection(異常偵測系統)的創建過程:
- output最高的分數是信心分;
- 判斷distribution平不平均,算熵(entropy)比方差更合適;
如何建立一個anomaly detection ?
有一組訓練集(Training Set)→Train a classifier →obtain confidence score c(x)
→根據信心分,打造異常偵測系統:f(x)
→Dev Set(這裏要有正常數據,和不正常數據),用Dev Set 來決定 λ 的值
→ 系統上線
- 不能拿正確率來衡量Anomaly Detection 的好壞。(現實中如大氣偵測等是很少有不正常數據的,可能幾千萬都是好數據)
2、評價Anomaly Detection系統好壞的方法:
detected&Normal (右上角)這一格指 “正常的內容被判爲異常”;→false
NotDet&Anomaly(左下角)這一格指 “異常的內容未被偵測出來”→ missing
最終,用cost table(扣分制)評價系統好壞;不同的情景不同任務有不同的cost table
(不同情境:檢測圖片是否匹配,往往採用上面的cost table A,即一個missing扣一分,一個false扣100分。
但如果是用於癌症的檢測,會採用cost table B,missing的扣分比重需要很大,一個missing扣100分;
因爲得了癌症但是未被檢測出來的代價很大。但沒得癌症被誤診爲患病的代價沒那麼大)