pandas提供了大量能使我們快速便捷地處理數據的函數和方法。
pandas中主要有兩種數據類型:
- Series: 一維 帶標籤數組
- DataFrame: 二維
DataFrame結構是由series構成的,series相當於矩陣當中的一行或者一列。
常用方法:
import pandas
food_info = pandas.read_cvs("food_info")
food_info.head(3) #顯示前三條數據(如果不傳參數,默認顯示前五條數據)
food_info.tail(3) #顯示最後三行數據
food_info.columns #得到所有的列名
food_info.shape #得到數據的行數和列數
food_info.loc[0] #取出索引爲0的數據
#可以直接用列名定位數據取出
col_names = food_info.columns.tolist() #將所有的列名組成一個List
food_info["iron"] = iron_gram #新建一列並且爲其賦值
food_info["iron"].max #得到這列數據中的最大值
titanic_survival.pivot_table(index = "Pclass",value = "Age")
#pivot_table的作用就是計算兩列的關係以Pclass分組來統計Age的數量
titanic_survival.dropna(axis = 0,subset=["Age","Sex"]])
#剔除Age和Sex中的缺失值
titanic_survival.sort_value("Age",ascending = False) #對Age進行降序排列