本文將介紹3個在數據集中查找離羣值的Python方法
離羣值(Outliers)是指在數據集中與其他數據點明顯不同或者異常的數據點。這些數據點可能比其他數據點要遠離數據集的中心,或者具有異常的數值。離羣值可能是由於數據採集錯誤、異常事件、測量誤差或者其他未知因素引起的。
離羣值的存在可以對數據分析和統計建模產生重要影響,因爲它們可能導致模型不準確或者產生誤導性的結果。
https://avoid.overfit.cn/post/2f9d9254f3a146bcb116f680906ec66a