Pandas常用操作

1.二值屬性轉換爲BOOL類型方法:y = 1 * (df.col_name == "attri_value") 返回的爲df,且其中元素等於"attri_value"的爲True,另一個值爲False。

2.統計df中每個特徵取值的分佈:df.column_name.value_counts().


3.

樣本標準偏差
  
  
代表所採用的樣本X1,X2,...,Xn的均值。
總體標準偏差
  
  
代表總體X的均值。
4.

dataframe一列變多列,其中用空格作分隔符

** table['address'].str.split(r' ',expand=True)**

用pd.concat把多列加回table,命名新的兩列Province, City
合起來就是





** pd.concat([table,table['address'].str.split(r' ',expand=True)],axis=1,names=['Province','City'])**












發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章