數據分析中數據異常的種類,第三個你一定想不到~

數據異常的三種主要類型

(1)違背常識的錯誤

比如調查上海市某小區居民的月收入,出現了小王的收入爲-5000,這就屬於異常值

(2)數據的離羣值

離羣值是指與其他數據差異較大,會對數據分析結果產生影響的觀測值,比如說一個人月收入是1000000000000000000000000元

離羣值的判斷和處理:
1.檢查同一客戶原表裏面是否有同樣的數值
2.再檢查這個數據是怎樣收集來的
3.從技術角度評估是否是離羣,如何對離羣進行處理

(3)數據格式不一樣

比如其他數字都是5000,10000,1000這樣,有幾個是999,
要考慮是否技術人員用999來填補空缺值?或者是這個人隨便亂填的?系統中是否是可選值?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章