pandas統計計算和描述

原創

2019-10-18 15:05

Pandas統計計算和描述

示例代碼：

import numpy as np
import pandas as pd

df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])
print(df_obj)

運行結果：

          a         b         c         d
0  1.469682  1.948965  1.373124 -0.564129
1 -1.466670 -0.494591  0.467787 -2.007771
2  1.368750  0.532142  0.487862 -1.130825
3 -0.758540 -0.479684  1.239135  1.073077
4 -0.007470  0.997034  2.669219  0.742070

常用的統計計算

sum, mean, max, min…

axis=0 按列統計，axis=1按行統計

skipna 排除缺失值，默認爲True

示例代碼：

df_obj.sum()

df_obj.max()

df_obj.min(axis=1, skipna=False)

運行結果：

a    0.605751
b    2.503866
c    6.237127
d   -1.887578
dtype: float64

a    1.469682
b    1.948965
c    2.669219
d    1.073077
dtype: float64

0   -0.564129
1   -2.007771
2   -1.130825
3   -0.758540
4   -0.007470
dtype: float64

常用的統計描述

describe 產生多個統計數據

示例代碼：

print(df_obj.describe())

運行結果：

              a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.180305  0.106488  0.244978  0.178046
std    0.641945  0.454340  1.064356  1.144416
min   -0.677175 -0.490278 -1.164928 -1.574556
25%   -0.064069 -0.182920 -0.464013 -0.089962
50%    0.231722  0.127846  0.355859  0.190482
75%    0.318854  0.463377  1.169750  0.983663
max    1.092195  0.614413  1.328220  1.380601

常用的統計描述方法：

count 非NA值的數量
describe 針對Series或各DataFrame列計算彙總統計
min、max 最大最小值
argmin、argmax 最小/最大值索引位置
idxmin、idxmax 最小/最大值的索引值
quantile 計算樣本的分位數（0到1）
sum 總和
mean 平均數
median 中位數（50%分位數）
mad 根據平均值計算平均絕對離差
var 樣本值的方差
std 樣本值的標準差
skew 樣本值的偏度（三階矩）
kurt 樣本值的峯度（四階矩）
cumsum 樣本值的累計和
cummin、cummax 樣本值的累計最大值和累計最小值
cumprod 樣本值的累計積
diff 計算一階差分（對時間序列很有用）
pct_change 計算百分數變化

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pandas統計計算和描述

Pandas統計計算和描述

常用的統計計算

sum, mean, max, min…

axis=0 按列統計，axis=1按行統計

常用的統計描述

describe 產生多個統計數據

常用的統計描述方法：

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

熟悉框架_聚寬

策略學習筆記_單因子策略_小市值策略

matplot繪圖

pandas的函數應用

數據清洗、合併、轉化和重構

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結