Python Pandas包學習小計

pandas一般用於讀取.csv文件,有些類似於電子表格,使用Python進行數據處理時經常會用到,以前學過一次,總不用容易忘記,再次簡單記錄。

#Pandas 基礎
import pandas as pd
import numpy as np
np.random.seed(1)
dates = pd.date_range('20181001',periods = 6)
s = pd.Series([1,2,np.nan,0,8,9],index = dates)
df = pd.DataFrame(np.random.randn(6,5),index = [2,3,1,0,9,6],columns = [i for i in 'acbed'])
df1 = pd.DataFrame(np.random.randn(6,4))
dic = {'a':[1.,2],'b':[2,3],'c':[3,4],'d':[4,5]}
df2 = pd.DataFrame(dic,index = ['a','b'])   #字典裏的key爲列,values是每列的數據
print(df)
df2.dtypes  #查看dataframe的數據類型
df2.index  #查看dataframe的行號
df2.columns #查看dataframe的列號
df2.values  #查看dataframe的值(內容)
df.describe() #描述dataframe的屬性(一般針對於數字操作)
df.sort_index(axis = 1,ascending=False)  #排序,axis = 0 是對行進行排序,axis = 1 是對列進行排序,ascending = False 指的是逆序
df.sort_values(by = 'a',ascending = False )   #排序,針對'a'列的元素降序(從大到小)排序

#pandas選擇數據
#打印某一列 da.a 或者 da['a']
df['b']
#打印前幾行
df[:4]

#select by label : loc
df.loc[3]  #index = 3 (不是第三行) ,即標籤爲3這行的數據
df.loc[:,['a','b']]  #打印所有行的第‘a'、'b'列數據

#select by position :iloc
df.iloc[3]  #打印第3行(其實是第4行)位置的數據
df.iloc[2:4,1:3]
df.iloc[[0,2,5],0:3] #若是df[[0,2,5],0:3]則不行,會報錯,df[]只能顯示行,eg:df[2],df[:3]

#mixed

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章