Pandas:基本統計分析

基本統計分析又叫描述性統計分析,一般統計某個變量的最小值,第一個四分位值,中值,第三個四分位值以及最大值。

描述性統計分析函數爲describe,該函數返回值有均值,標準差,最大值,最小值,分位數等。括號中可以帶一些參數,如percentitles=[0.2,0.4,0.6,0.8]就是指定只計算0.2, 0.6, 0.8 分位數,而不是默認的1/4, 1/2, 3/4分位數。

  • describe()
    1. mean : 均值
    2. median: 中位數
    3. mode: 衆數
    4. count: 計數
    5. std: 標準差

常用的統計函數有:

  • size: 計數(此函數不需要括號)
  • sum(): 求和
  • mean(): 平均值
  • var(): 方差
  • std(): 標準差
import pandas as pd

df = pd.read_excel(r'/pylearn/examples/i_nuc.xls', sheet_name='Sheet7')
print(df)

print(df.數分.describe()) #查看 數分 列 的基本統計

print(df.describe()) # 查 各列 的基本統計

print(df.解幾.size) #
print("最大值", df['解幾'].max()) #
print("最小值",df['解幾'].min()) #
print("求總和",df['解幾'].sum()) #
print("求均值",df['解幾'].mean()) #
print("求方差",df['解幾'].var()) #
print("標準差",df['解幾'].std()) #


"""
    Numpy數組也可以使用mean函數計算樣本均值,也可以使用average函數計算加權的樣本均值

"""

#用mean函數計算“數分“的平均函數

import numpy as np

print(np.mean(df['數分']))

#還可以使用average函數計算“數分“的平均成績
print(np.average(df['數分']))


#也可以使用pandas的DataFrame對象的mean方法求均值。
print(df['數分'].mean())

#計算中位數
print(df.median())

"""
 對於定性數據來說,衆數是出現次數最多的值,使用mode()計算衆數。
"""
print(df.mode())

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章