參考:
http://blog.163.com/zhoulili1987619@126/blog/static/353082012015211114642546/
統計方法
- 假設正常點和異常點都有一個分佈。開始時,所有點都服從正常點的分佈。然後,假設一個點是異常點,則它服從異常點的分佈。計算前後的似然差異。如果較大,那的確是異常點。繼續計算下一個點。
基於鄰近度的離羣點檢測
- k近鄰,計算距離
基於密度的離羣點檢測
- 計算密度
基於聚類的技術
- 某個簇的個數太少,則爲離羣點
參考:
http://blog.163.com/zhoulili1987619@126/blog/static/353082012015211114642546/
統計方法
基於鄰近度的離羣點檢測
基於密度的離羣點檢測
基於聚類的技術