文章目錄
三、數值取值與選擇
1.Series數據選擇方法
Series 對象與一維 NumPy 數組和標準 Python 字典在許多方面都一樣。
1). 將Series看作字典
和字典一樣, Series 對象提供了鍵值對的映射
用 Python 字典的表達式和方法來檢測鍵 / 索引和值
Series 對象還可以用字典語法調整數據。
2). 將Series看作一維數組
Series 不僅有着和字典一樣的接口,而且還具備和 NumPy 數組一樣的數組數據選擇功能,包括索引、 掩碼、 花哨的索引等操作
3). 索引器: loc、 iloc和ix
這些切片和取值的習慣用法經常會造成混亂。特別是當顯示索引用整數表示時。
所以 Pandas 提供了一些索引器(indexer)屬性來作爲取值的方法。它們不是 Series 對象的函數方法,而是暴露切片接口的屬性。
- loc 屬性——顯式
- iloc 屬性—— 隱式
- ix 現已過期
2.DataFrame數據選擇方法
1). 將DataFrame看作字典
按照上一節的方法,使用Series對象字典創建DataFrame
- 字典形式取列——d[k] --df[name]
- 屬性形式取列 df.name(非字典屬性)
兩者等價,避免對用屬性形式選擇的列直接賦值
- 用字典形式的語法調整對象,比如新增列
2). 將DataFrame看作二維數組
用 values 屬性按行查看數組數據
用T方法進行轉置
3). 其他方法和索引器: loc、 iloc和ix
ix已經過期,其餘方法取行列總結如下
這裏:
是指爲篩選的所有行,如果想對行進行篩選,可以替換成條件,如data.loc[data.are>10000,'are']
掩碼操作