python——數據分析函數

1、pandas.notnull():去掉空值行

pandas.isnull():只要空值行

2、數據集.列.unique():只顯示不重複的指標值

3、數據集.列.value_count():統計某列各個指標的個數 並按降序排列

4、數據集.groupby(‘列’):以某列爲key對其他列進行相應計算(類似於以某列分組)

5、numpy.linspace(x,y,n):產生以x爲起始,以y爲終止,n個元素個數

6、get_dummies(數據集['列'],prefix='列名'):one-hot編碼(若離散特徵的取值大小無意義,比如顏色、位置等等)把某一列具有n個屬性轉換成n列指標,且每個數據在n個指標中只有一個值,新列的名稱以prefix爲前綴再加上自身的名稱

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章