pandas分組聚合

原創

2019-10-26 03:26

基本操作

import pandas as pd
import numpy as np
df = pd.DataFrame({'a':['one','two','one','two'],
                   'b':['key1', 'key1','key2','key2'],
                   'c':[2,3,4,5],
                  'd':[2,1,2,3],
                  'e':[3,3,4,4]})

df

# 對a進行分組，使用mean聚合函數，方法1
df.groupby('a').agg(['mean'])

# 對a進行分組，使用mean聚合函數，方法2
df[['c','d','e']].groupby(df['a']).agg(['mean'])

# 對a,b進行分組，使用mean，sum聚合函數
df.groupby(['a','b']).agg(['mean','sum'])

GroupBy對象支持迭代操作

grouped1 = df_obj.groupby('key1')
grouped2 = df_obj['data1'].groupby(df_obj['key1'])

# 單層分組，根據key1
for group_name, group_data in g1:
    print(group_name)
    print(group_data)

# 多層分組，根據key1 和 key2
for group_name, group_data in g2:
    print(group_name)
    print(group_data)

GroupBy對象可以轉換成列表或字典

# groupby對象轉換爲列表
d = list(g1)

print(d)

d[0][0]  # 'one'

d[0][1]

# groupby對象轉換爲字典

dic = dict(list(g1))
print(dic)

dic.keys()  # dict_keys(['one', 'two'])

dic['one']

透視表

import pandas as pd

# 構造數據
df = pd.DataFrame({'A': np.random.randint(3, size=(5, )), 'B': ['a', 'b', 'a', 'c', 'b'], 'C': np.random.randint(4, size=(5, ))})

# 透視表
df1 = df.pivot(index='A', columns='B', values='C')

# 重置索引
df1.reset_index(inplace=True)

df1.columns.name=None

df

df1

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pandas分組聚合

基本操作

GroupBy對象支持迭代操作

GroupBy對象可以轉換成列表或字典

透視表

基於 Nginx Ingress + 雲效 AppStack 實現灰度發佈

12款高效開源Wiki系統推薦，打造團隊知識管理利器

C語言--右移左移

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

鼠標控制軟件有可能和虛擬機軟件產生衝突

sm4加密工具類

文本轉化爲向量

初次使用BERT的可視化指南

神經網絡的前向傳播和反向傳播推導

numpy庫

機器學習：K近鄰（KNN）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結