【Python數據科學手冊】Pandas——三、數據取值與選擇

三、數值取值與選擇

1.Series數據選擇方法

Series 對象與一維 NumPy 數組和標準 Python 字典在許多方面都一樣。

1). 將Series看作字典

和字典一樣, Series 對象提供了鍵值對的映射
在這裏插入圖片描述
用 Python 字典的表達式和方法來檢測鍵 / 索引和值
在這裏插入圖片描述
Series 對象還可以用字典語法調整數據。
在這裏插入圖片描述

2). 將Series看作一維數組

Series 不僅有着和字典一樣的接口,而且還具備和 NumPy 數組一樣的數組數據選擇功能,包括索引、 掩碼、 花哨的索引等操作
在這裏插入圖片描述

3). 索引器: loc、 iloc和ix

這些切片和取值的習慣用法經常會造成混亂。特別是當顯示索引用整數表示時。
在這裏插入圖片描述
所以 Pandas 提供了一些索引器(indexer)屬性來作爲取值的方法。它們不是 Series 對象的函數方法,而是暴露切片接口的屬性。

  • loc 屬性——顯式
    在這裏插入圖片描述
  • iloc 屬性—— 隱式
    在這裏插入圖片描述
  • ix 現已過期

2.DataFrame數據選擇方法

1). 將DataFrame看作字典

按照上一節的方法,使用Series對象字典創建DataFrame
在這裏插入圖片描述

  • 字典形式取列——d[k] --df[name]
  • 屬性形式取列 df.name(非字典屬性)
    兩者等價,避免對用屬性形式選擇的列直接賦值
    在這裏插入圖片描述
  • 用字典形式的語法調整對象,比如新增列
    在這裏插入圖片描述

2). 將DataFrame看作二維數組

用 values 屬性按行查看數組數據
在這裏插入圖片描述
用T方法進行轉置
在這裏插入圖片描述

3). 其他方法和索引器: loc、 iloc和ix

ix已經過期,其餘方法取行列總結如下
在這裏插入圖片描述
這裏:是指爲篩選的所有行,如果想對行進行篩選,可以替換成條件,如data.loc[data.are>10000,'are']
掩碼操作
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章