1. 缺失值處理
缺失值處理主要有三個內容、四個函數:發現缺失值(isnull() notnull())、刪除缺失值(dropna())、填補缺失值(fillna())
首先創建一個矩陣
1.1 發現缺失值
發現缺失值是生成布爾類型的掩碼數據,兩個函數相反
1.2 刪除缺失值
基本類型dropna(axis=0, how =‘any’,tresh) ,其中axis是按行還是按列刪除、how有兩種any-有缺失值即刪除和all-全部確實刪除、tresh是限定非缺失值的數量
eg1:有缺失刪除該列
eg2:按列,全部缺失刪除
eg3:按列,非缺失值至少爲三個
1.3 填補缺失值
填補缺失值fillna(),除了給固定值,還可以method參數,有ffill-從前向後填充和bfill-從後向前填充
固定值填充
按列前向填充