缺失值處理知識點整理

缺失值處理
來源《Python數據分析與數據化運營》
批註1:
(丟棄)不宜採用的場景:
(1)數據集總體中存在大量的數據記錄不完整情況且比例較大,例如超過10%,刪除這些帶有缺失值的記錄意味着將會損失過多有用信息。
(2)帶有缺失值的數據記錄大量存在着明顯的數據分佈規律或特徵,例如帶有缺失值的數據記錄的label主要集中於某一類或者某積累,如果刪除會導致對應的數據樣本丟失大量特徵信息,導致模型過擬合或分類不準確
批註2:
(插值)方法
拉格朗日插值
牛頓插值
Hermite插值
分段插值
樣條插值

發佈了196 篇原創文章 · 獲贊 73 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章