【pandas】常用統計指標

1. 分位數

pandas 和 numpy中都有計算分位數的方法,pandas中是quantile,numpy中是percentile

兩個方法其實沒什麼區別,用法上稍微不同,quantile的優點是與pandas中的groupby結合使用,可以分組之後取每個組的某分位數

  • quantile
import numpy as np
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import os,sys

os.chdir('/Users/cc/Documents/cc工作生意金/標準化平臺/儲蓄卡相關/儲蓄卡變量分析/數據') 
data1=pd.read_csv('chuxuka_data.csv')

#將data按LOAN_MONTH分組
grouped=data1.groupby(['loan_month'])
#用quantile計算每個月份的第40%的分位數
grouped['trans_num_new'].quantile(0.4) 

在這裏插入圖片描述

  • PERCENTILE
    a=np.array(data1['trans_num_new']) np.percentile(a,0.4)
    在這裏插入圖片描述

2. 取整

向上取整ceil 向下取整FLOOR 四捨五入 round

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章