注:本文是學習+整理的原創喔
基礎部分
import pandas as pd
import numpy as np
設置行列最大數
pd.set_option('max_column',8,'max_rows',10)
文件讀取:pd.read_csv
DataFrame組件訪問:data.colunms data.index data.values
type查看數據類型或行列屬性;data.['屬性名']亦可
調用Series方法pd.Series
最大顯示行數:pd.set_option('max_rows',8)
屬性值出現次數:columns.value_counts()
屬性值中位分位數:columns.quantile()
data.min(skipna=False) 參數說明:只計算非缺失值列 .max() .mean() .median() .std() .sum() 分別查看最小值、最大值、平均值、中位數、標準差、總和
data.isnull()查看空值 .isnull().mean()查看空值比例 屬性.fillna(0)填補空值 屬性.dropna()刪除空值
data.value_counts(normalize=True) 查看每個值出現的頻率
data.hasnans 判斷是否有缺失值 屬性.notnull()判斷是否爲非缺失值
data可直接進行四則運算+ - * /
.add()加法 .mul()乘法 .floordiv()底除 .gt()篩選大於 .eq()篩選等於 .mod取模長
括號串聯篩選示例:(data.fillna(0).astype(int).head())
增加列名:data['列名']=0 注:也可使用insert()方法直接插入列與值
data.all()檢查是否所有布爾值都爲ture
篩選數據
篩選多列:data[['a','b']] 或者
pd.DataFrame(data,columns=['Height','Weight'])
篩選特定數據列:data.select_dtypes(include=['輸入要篩選的數據類型']).head()
.ndim() 查看數據維度
數據分析部分
(明天接着寫~)