Pandas兩種主要的數據結構

OUTLINE

  • Series
  • pandas

pandas中的數據結構主要包括兩種,一種是Series,一種是dataframe。

Series

Series表示一維數據,可以簡單理解爲一個向量,但是不同於向量的是,Series會自動爲這一維數據創建行索引。

① 創建Series

import pandas as pd
series_obj = pd.Series(['a','b','c'])

② Series本身的屬性有兩種,一種是index,一種是values

series_obj.index # 查看series的index
series_obj.values # 查看series的values

③ 查看Series的前幾行

series_obj.head(1) # 可以將1替換成想查看的任何行數

dataframe

dataframe是一種表格型的數據結構,既有行索引index,也有列索引columns。其實可以簡單把dataframe理解爲一張數據表。

① 創建dataframe

通過字典方式創建, key相當於列索引中的每一列的“列名”

data_dict = {'a':[1,2,3],'b':[2,3,4]}
print(data_dict)

通過無索引的數據矩陣,添加columns

a = [[1,2,3],[2,3,4]]
data = pd.DataFrame(a,columns=('a','b','c'))

② 同樣地,對於pandas來說,有三種屬性可以調用,一是index,二是columns,三是values
③ dataframe的索引問題

按照字段名稱選列

data['a']  # 找出一列
data[['a','b']]  # 找出兩列或多列數據

按照字段位置選列和行

data.loc[0,:]  # 找出某一行的數據
data.loc[[0,1],:]  # 找出一二行的數據

找出dataframe的前/後多少行

data.head(2)  # 前兩行
data.tail(2)  # 後兩行

④ dataframe的排序問題

data2 = data.sort_index(ascending=False)
data3 = data.sort_values(by='b',ascending=True)

⑤ dataframe的數據添加與刪除

data['d'] = [4,2]
del data['d']

⑥ dataframe用於數據探索

data.info()
data.describe()
發佈了37 篇原創文章 · 獲贊 61 · 訪問量 16萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章