數據分析處理庫-pandas

pandas提供了大量能使我們快速便捷地處理數據的函數和方法。

pandas中主要有兩種數據類型:

  • Series: 一維   帶標籤數組
  • DataFrame: 二維 

DataFrame結構是由series構成的,series相當於矩陣當中的一行或者一列。

常用方法:

import pandas
food_info = pandas.read_cvs("food_info")
food_info.head(3)    #顯示前三條數據(如果不傳參數,默認顯示前五條數據)
food_info.tail(3)    #顯示最後三行數據
food_info.columns    #得到所有的列名
food_info.shape      #得到數據的行數和列數
food_info.loc[0]     #取出索引爲0的數據
#可以直接用列名定位數據取出
col_names = food_info.columns.tolist()   #將所有的列名組成一個List
food_info["iron"] = iron_gram      #新建一列並且爲其賦值
food_info["iron"].max       #得到這列數據中的最大值
titanic_survival.pivot_table(index = "Pclass",value = "Age") 
                        #pivot_table的作用就是計算兩列的關係以Pclass分組來統計Age的數量
titanic_survival.dropna(axis = 0,subset=["Age","Sex"]])  
                         #剔除Age和Sex中的缺失值 
titanic_survival.sort_value("Age",ascending = False)    #對Age進行降序排列 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章