SPSS數據分析前,異常值處理

轉載來源:

http://bbs.pinggu.org/thread-1542766-1-1.html

h請教一個問題:在一組測量數據中(有幾百個)剔除異常值,是採用(平均值±3倍標準差)的方法,爲什麼在進行異常值剔除後的數據中進行檢驗,還是有異常值存在呢?是不是需要再進行多次的這樣的操作呢,直至達到不再有異常值存在?

樓主這個異常值處理方法是平均值±3倍標準差,那其實平均值±2.9倍左右標準差在你剔除前面的平均值±3倍標準差數據後再做異常值檢驗時就可能成爲新的異常值,在這種情況下我不建議純粹的以平均值±3倍標準差來剔除異常值。因爲還可能存在很多數據標準差在平均值±(2.8-3.0)倍標準差之間,這些也可能是異常值呢。那麼在這種情況下應該怎麼辦呢?我個人的經驗是如果要做迴歸,可以考慮做分位數迴歸,這個就不要考慮異常值的影響,可以直接做。還有就是可考慮使用縮尾或者截尾處理,或者對數據進行變換(如偏正態分佈數據用取對數處理)。總之,異常值處理要慎重,還需結合專業知識具體判斷。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章