dataframe一些簡單方法

總結一下,最近用到的dataframe的簡單的方法

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns=list('abc'))
print('df',df)
#1.對列進行操作,axis=1
df1 = df.apply(lambda x:x['a']*10 + x['b'],axis=1)
print('df1',df1)
#2.對行進行操作,axis=0
df2 = df.apply(lambda x:x[0]*10 + x[1],axis=0)
print('df2',df2)
#3.對行進行操作,增加判斷條件,lambda+if
df3 = df.apply(lambda x:x[0]*10 + x[1] if x[0]>0 else x[0],axis=0)
print('df3',df3)
#4.擴展數據框的列
df['d'] = df1
print('df',df)
#5.擴展數據框的行,或者疊加兩個數據框,使用append
df4 = df.append(df2,ignore_index=True)
print('df4',df4)
#6.分組,groupby裏面的字段內的數據重構後都會變成索引,以a進行分組(a列爲索引),對bc列進行求和。注意:groupby後一般需要帶一個
# 方法mean(),sum(),first(),last()。
df5 = df4.groupby(['a'])[['b','c']].sum()
print('df5',df5)
#7.修改列名,也可使用rename
df4.columns = ['e','f','g','h']
print('df4',df4)
#8.修改索引名,也可使用rename
df4.index = list('56789')
print('df4',df4)
#9.獲取列中有某特定元素的數據框,使用isin,獲取c列元素值等於1和3的數據框
# df6 = df[df['c'].isin(['1','3'])]
#10.去重,drop_duplicates

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章