Pandas數據分析——從0.5到1學習指南

 注:本文是學習+整理的原創喔 

 基礎部分

import pandas as pd
import numpy as np

設置行列最大數

pd.set_option('max_column',8,'max_rows',10)

文件讀取:pd.read_csv

DataFrame組件訪問:data.colunms   data.index   data.values

type查看數據類型或行列屬性;data.['屬性名']亦可

調用Series方法pd.Series

最大顯示行數:pd.set_option('max_rows',8)

屬性值出現次數:columns.value_counts()

屬性值中位分位數:columns.quantile()

data.min(skipna=False) 參數說明:只計算非缺失值列         .max()    .mean()    .median()       .std()    .sum() 分別查看最小值、最大值、平均值、中位數、標準差、總和

data.isnull()查看空值       .isnull().mean()查看空值比例       屬性.fillna(0)填補空值      屬性.dropna()刪除空值

data.value_counts(normalize=True) 查看每個值出現的頻率

data.hasnans 判斷是否有缺失值          屬性.notnull()判斷是否爲非缺失值   

data可直接進行四則運算+ - * /

.add()加法    .mul()乘法    .floordiv()底除    .gt()篩選大於    .eq()篩選等於  .mod取模長 

括號串聯篩選示例:(data.fillna(0).astype(int).head())

增加列名:data['列名']=0   注:也可使用insert()方法直接插入列與值

data.all()檢查是否所有布爾值都爲ture

篩選數據

篩選多列:data[['a','b']]  或者

pd.DataFrame(data,columns=['Height','Weight'])

篩選特定數據列:data.select_dtypes(include=['輸入要篩選的數據類型']).head()

.ndim() 查看數據維度

數據分析部分

 

(明天接着寫~)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章