OUTLINE
- Series
- pandas
pandas中的數據結構主要包括兩種,一種是Series,一種是dataframe。
Series
Series表示一維數據,可以簡單理解爲一個向量,但是不同於向量的是,Series會自動爲這一維數據創建行索引。
① 創建Series
import pandas as pd
series_obj = pd.Series(['a','b','c'])
② Series本身的屬性有兩種,一種是index,一種是values
series_obj.index # 查看series的index
series_obj.values # 查看series的values
③ 查看Series的前幾行
series_obj.head(1) # 可以將1替換成想查看的任何行數
dataframe
dataframe是一種表格型的數據結構,既有行索引index,也有列索引columns。其實可以簡單把dataframe理解爲一張數據表。
① 創建dataframe
通過字典方式創建, key相當於列索引中的每一列的“列名”
data_dict = {'a':[1,2,3],'b':[2,3,4]}
print(data_dict)
通過無索引的數據矩陣,添加columns
a = [[1,2,3],[2,3,4]]
data = pd.DataFrame(a,columns=('a','b','c'))
② 同樣地,對於pandas來說,有三種屬性可以調用,一是index,二是columns,三是values
③ dataframe的索引問題
按照字段名稱選列
data['a'] # 找出一列
data[['a','b']] # 找出兩列或多列數據
按照字段位置選列和行
data.loc[0,:] # 找出某一行的數據
data.loc[[0,1],:] # 找出一二行的數據
找出dataframe的前/後多少行
data.head(2) # 前兩行
data.tail(2) # 後兩行
④ dataframe的排序問題
data2 = data.sort_index(ascending=False)
data3 = data.sort_values(by='b',ascending=True)
⑤ dataframe的數據添加與刪除
data['d'] = [4,2]
del data['d']
⑥ dataframe用於數據探索
data.info()
data.describe()