pandas中Groupby通過字典或Series進行分組

原創

2020-02-22 03:36

#-*- coding:utf-8 -*-
import pandas as pd
import numpy as np
people=pd.DataFrame(np.random.randn(5,5),columns=['a','b','c','d','e']
                    ,index=['Joe','Steve','Wes','Jim','Travis'])
people.ix[2:3,['b','c']]=np.nan#添加幾個NA值
#假設已知列的分組關係，並希望根據分組計算列的總計：
mapping={'a':'red','b':'red','c':'blue','d':'blue','e':'red','f':'orange'}
by_column=people.groupby(mapping,axis=1)#只需要將mapping傳給groupby即可
print by_column.sum()

#series也有同樣的功能，它可以看做一個固定大小的映射。對於上面那個例子，如果用series作爲分組鍵，則pandas
#會檢查series以確保其索引跟分組軸是對齊的
map_series=pd.Series(mapping)
print people.groupby(map_series,axis=1).count()

發佈了77 篇原創文章 · 獲贊 77 · 訪問量 34萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

盤點一個Pandas數據分組的問題

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【上海新年人】問了一個Pandas數據分組的問題，問題如下： list1 = '電子稅票號碼徵收稅務機關社保經辦機構單位編號費種徵收品目徵收子目費款所屬

2024-06-07 10:02:02

這種嵌套字典類型的數據，我想把它讀取到df裏，如何操作？

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【WYM】問了一個Pandas處理的問題，提問截圖如下：原始數據： temp = dict() temp[64001] = {64002: 1.0, 64003: 1.0,

2024-05-30 10:02:40

安裝筆記本應用商店的pycharm，再安排pandas等模塊，說是沒有打包工具?

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【斌】問了一個Python庫安裝的問題。求教大佬：華爲筆記本，麒麟系統，安裝筆記本應用商店的pycharm，再安排pandas等模塊，說是沒有打包工具，再安裝

2024-05-25 10:02:28

Python爬蟲技術與數據可視化：Numpy、pandas、Matplotlib的黃金組合

前言在當今信息爆炸的時代，數據已成爲企業決策和發展的關鍵。而互聯網作爲信息的主要來源，網頁中蘊含着大量的數據等待被挖掘。Python爬蟲技術和數據可視化工具的結合，爲我們提供了一個強大的工具箱，可以幫助我們從網絡中抓取數據，並將其可視

2024-04-29 23:26:28

五一假期暢遊指南：Python技術構建的熱門景點分析系統解讀

導言五一假期即將到來，作爲一名熱愛旅遊的技術達人，我總是希望能夠通過技術手段更好地規劃我的旅行路線。在這篇文章中，我將向大家介紹一款基於Python技術的熱門景點分析系統，幫助您在五一假期中游玩得更加盡興！ 1. 系統概述熱門景點

2024-04-16 23:25:46

從靜態到動態化，Python數據可視化中的Matplotlib和Seaborn

本文分享自華爲雲社區《Python數據可視化大揭祕：Matplotlib和Seaborn高效應用指南》，作者：檸檬味擁抱。安裝Matplotlib和Seaborn 首先，確保你已經安裝了Matplotlib和Seaborn庫。如果沒有

2024-03-25 11:01:41

05-快速理解SparkSQL的DataSet

1 定義一個數據集是分佈式的數據集合。Spark 1.6增加新接口Dataset，提供 RDD的優點：強類型、能夠使用強大lambda函數 Spark SQL優化執行引擎的優點可從JVM對象構造Dataset，然後函數式轉換（map

2024-03-25 02:48:38

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

盤點一個Pandas處理json數據的實戰案例

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【黑科技·鼓包】問了一個Pandas處理json數據的問題。問題如下：大佬們請教下一個很簡單的問題，因爲我半瓢水也不知道該怎麼解決，問AI好像也寫不好描述，麻煩幫

2024-03-06 22:16:06

微博數據可視化分析：利用Python構建信息圖表展示話題熱度

1. 引言隨着社交媒體的迅速發展，微博已成爲人們交流觀點、表達情感的重要平臺之一。微博評論數據蘊含着豐富的信息，通過對這些數據進行分析和可視化，我們可以深入瞭解用戶對特定話題的關注程度和情感傾向。本文將介紹如何利用Python進行微博

2024-02-20 00:22:15

盤點一個txt文檔合併的實戰需求（方法三）

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示：上一篇文章中我們已經看到了3個方法，這一篇文章我們一起來看看另外一個方法。二、實現過程這裏【吳超建】斗

2024-02-04 21:53:00

盤點一個txt文檔合併的實戰需求（方法一）

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示：二、實現過程這裏【隔壁😼山楂】給了一個指導，如下所示：並給出瞭如下代碼： from pathlib

2024-02-02 21:54:46

適合 Python 入門的 8 款強大工具！

Python是一種開源的編程語言，可用於Web編程、數據科學、人工智能以及許多科學應用。學習Python可以讓程序員專注於解決問題，而不是語法。由於Python相對較小，且擁有各式各樣的工具，因此比Java和C++等語言更具優勢，同時豐富的

雲棲號資訊小編

2020-07-27 11:40:52

學習Python兩年，我的人生軌跡發生了怎樣的變化？

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！學習Python的經歷教會了我很多東西，可以說，它深深地改變了我的人生軌跡。這段學習經歷告訴我：關注自己能掌握的東西，通過開源站在巨人的

雲棲號資訊小編

2020-07-10 11:58:53

KNN算法第二章 Pandas & sklearn 機器學習實戰 Machine Learning in action

本專欄計劃藉助Pandas與sklearn重新實現書中的實戰案例。 k-近鄰算法1. KNN算法流程2. KNN改進約會網站的配對效果2.1 數據準備：從文本中解析數據2.2 數據可視化：散點圖2.3 數據處理：歸一化數值2.4

2020-07-08 11:09:44

24小時熱門文章

最新文章

最新評論文章