1、pandas.notnull():去掉空值行
pandas.isnull():只要空值行
2、數據集.列.unique():只顯示不重複的指標值
3、數據集.列.value_count():統計某列各個指標的個數 並按降序排列
4、數據集.groupby(‘列’):以某列爲key對其他列進行相應計算(類似於以某列分組)
5、numpy.linspace(x,y,n):產生以x爲起始,以y爲終止,n個元素個數
6、get_dummies(數據集['列'],prefix='列名'):one-hot編碼(若離散特徵的取值大小無意義,比如顏色、位置等等)把某一列具有n個屬性轉換成n列指標,且每個數據在n個指標中只有一個值,新列的名稱以prefix爲前綴再加上自身的名稱