本篇內容思維導圖:
1. series的定義
series:由一組數據及與之相關的數據索引組成。
2. series的創建方法
2.1 列表的形式
例如:
george_dupe = pd.Series([10,7,1,22],index=['1968','1969','1970','1970'],name='George Songs')
2.2 字典的形式
例如:
george2 = pd.Series({'1969':7,'1970':[1,22]},index=['1969','1970','1970'])
注意:
列表和字典創建series的差別:列表中可以存在重複的index,它可以對應不同的value值,但是字典不可以! 當然,如果index中存在重複值對應不同的value,索引index時的輸出結果會是一個object series。
2.3 ndarray 的形式
d = pd.Series(np.arange(5),index=np.arange(9,4,-1))
3. series的in
判斷
-
.values()
獲得數組中的value -
.iteritems()
可以以數組的形式將index和其對應的value展示
4. 簡單瞭解series的更新(後面有更詳細的)
4.1 切片[]
的方式
eg: george_dupe['1973'] = 11
它可以更新原有index的value值,也可以增加index及其對應值
4.2 series中增加和刪減元素
4.2.1 增加元素
-
.append()
方法
產生一個比原series元素更多的新series;但是並不改變原series的結構
eg:george_dupe.append(pd.Series({'1974':9}))
-
.set_value()
方法
產生一個比原series元素更多的新series;同時改變原series的結構
4.2.2 刪減元素
-
del
pandas一般是不刪除內容的,通常是通過過濾的方式,選擇自己想要的數據生成新的series。不過如果你想要刪除sereies 裏面的內容,可以使用del(base on the index)。
-
過濾法
pandas可以通過boolean array進行過濾,這個方法更靠譜
5. 判斷index是否重複
-
.is_unique
判斷index是否有重複(因爲pandas的index不是unique):
eg:george.index.is_unique