python DataFrame的apply方法

原創

内心的笃定

2018-09-03 20:14

#函数应用和映射
import numpy as np
import pandas as pd
df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon'])
print(df)

 b         d         e
utah   -0.451195 -0.183451 -0.297182
ohio    0.443792  0.925751 -1.320857
texas   1.039534 -0.927392  0.611482
oregon  0.938760  1.265244  0.313582

#将函数应用到由各列或行形成的一维数组上。DataFrame的apply方法可以实现此功能
f=lambda x:x.max()-x.min()
#默认情况下会以列为单位，分别对列应用函数
t1=df.apply(f)
print(t1)
t2=df.apply(f,axis=1)
print(t2)

b    1.490729
d    2.192636
e    1.932339
dtype: float64
utah      0.267744
ohio      2.246608
texas     1.966925
oregon    0.951662
dtype: float64

#除标量外，传递给apply的函数还可以返回由多个值组成的Series
def f(x):
    return pd.Series([x.min(),x.max()],index=['min','max'])
t3=df.apply(f)
#从运行的结果可以看出，按列调用的顺序，调用函数运行的结果在右边依次追加
print(t3)

b         d         e
min -0.451195 -0.927392 -1.320857
max  1.039534  1.265244  0.611482

#元素级的python函数，将函数应用到每一个元素
#将DataFrame中的各个浮点值保留两位小数
f=lambda x: '%.2f'%x
t3=df.applymap(f)
print(t3)

 b      d      e
utah    -0.45  -0.18  -0.30
ohio     0.44   0.93  -1.32
texas    1.04  -0.93   0.61
oregon   0.94   1.27   0.31

#注意，这里之所以叫applymap,是因为Series有一个永远元素级函数的map方法
t4=df['e'].map(f)
print(t4)

utah      -0.30
ohio      -1.32
texas      0.61
oregon     0.31
Name: e, dtype: object

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

python实现基金定投并可视化结果（及时止损）

1.什麼是指數基金 2.什麼是基金定投 3.本次數據來源 4.作出假設每週定投一次，每次定投500，計算2019年對滬深300指數基金進行定投的收益率每週定投一次，每次定投500，分別計算從2002年開始到2019年，每年定

2020-07-07 18:05:31

Python数据分析与挖掘实战Chapter7 航空公司客户价值分析

1.數據探索 #-*- coding: utf-8 -*- #對數據進行基本的探索，返回缺失值以及最大值，最小值 import pandas as pd datafile='G:/學習資料/統計/chapter7/demo/data

weixin_42764993

2020-07-06 13:07:27

【pandas】[9] pandas loc、iloc

創建一個dataframe import numpy as np import pandas as pd #創建一個Dataframe data=pd.DataFrame(np.arange(16).reshape(4,4),index

2020-07-06 09:40:22

【phantomjs】爬虫安装使用

phantomJS：的用處可謂非常廣泛諸如網絡監測、網頁截屏、無需瀏覽器的wen測試、頁面訪問自動化等。 phantomjs的下載安裝： http://phantomjs.org/download.html 下載完成後，直接解壓到桌面。

2020-07-04 23:33:26

matplotlib画图相关知识

Matplotlib 數據可視化 matplotlib庫的介紹數據可視化第三方庫 matplotlib.pyplot 是繪製各類可視化圖形的命令子庫，相當於快捷方式。 import matplotlib.pyplot as pl

2020-07-04 17:56:51

numpy库相关知识

文章目錄numpy庫函數速查表numpy庫入門數據維度numpy介紹ndarray對象的屬性ndarray數組的創建和變換ndarray數組的變換ndarray數組的操作ndarray數組的運算numpy的隨機數函數numpy的統

2020-07-04 17:56:51

Python运算符和表达式

本文轉載自http://www.cnblogs.com/yueya/p/5811937.html 算術運算符：比較運算符：賦值運算符：位運算符：邏輯運算符：身份運算符：對比：isinst

liangyingyi1006

2020-07-04 10:41:01

python学习笔记——numpy

補充tile(val,(x,y))將val內容複製x行，y列。val可以使單個值，也可以是列表shape()查看矩陣或者數組的維數；如果是一個值，返回'()';如果存在x行，y列，返回'(x,y)';含有n個值得一維數組，返回'(n,)'

2020-07-04 02:08:38

使用Python玩转word

需求：客戶提供Excel表格試題試卷，要求我們隨機生成10份word文檔試卷，試題內容隨機排序。讀取Excel中數據生成word試卷定義生成試卷的總數讀取Excel中數據 # -*- coding: utf-8 -*- """

奥斯维克鸡腿学徒

2020-07-03 15:55:48

【Python数据分析】1st-数据探索与数据预处理

《Python數據分析與挖掘實戰》讀書筆記之數據探索與數據預處理文章目錄@[toc] ##一、數據探索 Python中用於數據探索的庫主要是Pandas（數據分析）和Matplotlib（數據可視化） ###數據分析內容數據質

2020-07-02 21:24:03

[数据分析基础] 2. Matplotlib库

[數據分析基礎] 2. Matplotlib庫文章目錄[數據分析基礎] 2. Matplotlib庫一、Matplotlib庫入門1. pyplot的繪圖區域2. pyplot的plot()函數format_string**kw

2020-07-02 19:25:02

利用Python进行数据分析(三)：绘图与可视化

本文爲《利用Python進行數據分析》的部分讀書筆記目錄matplotlib入門圖片與子圖顏色，標記和線類型刻度，標籤和圖例將圖片保存到文件顯示圖像註釋與子圖加工matplotlib設置 matplotlib入門本文爲入門內

2020-07-02 18:52:51

利用Python进行数据分析(一)：IPython及Jupyter notebook

本文爲《利用Python進行數據分析》的部分讀書筆記目錄IPython與Jupyter notebook簡介IPython基礎使用IPython命令行運行Jupyter notebook配置文件Jupyter Notebook

2020-07-02 18:52:51

利用Python进行数据分析(二)：Numpy

本文爲《利用Python進行數據分析》的部分讀書筆記目錄Numpy ndarray: 多維數組對象ndarray屬性NumPy 數據類型生成ndarrayNumpy數組算術基礎索引與切片布爾索引神奇索引數組轉置與轉軸通用函數：快

2020-07-02 18:52:51

数据分析之Pandas-01Series和DataFrame

01-什麼是Pandas Python Data Analysis Library 或 pandas 是基於NumPy 的一種工具，該工具是爲了解決數據分析任務而創建的。 pandas 納入了大量庫和一些標準的數據模型，提供了高

Python小学生

2020-07-02 10:12:42

24小時熱門文章

最新文章

最新評論文章