【Python数据科学手册】Pandas——三、数据取值与选择

三、数值取值与选择

1.Series数据选择方法

Series 对象与一维 NumPy 数组和标准 Python 字典在许多方面都一样。

1). 将Series看作字典

和字典一样, Series 对象提供了键值对的映射
在这里插入图片描述
用 Python 字典的表达式和方法来检测键 / 索引和值
在这里插入图片描述
Series 对象还可以用字典语法调整数据。
在这里插入图片描述

2). 将Series看作一维数组

Series 不仅有着和字典一样的接口,而且还具备和 NumPy 数组一样的数组数据选择功能,包括索引、 掩码、 花哨的索引等操作
在这里插入图片描述

3). 索引器: loc、 iloc和ix

这些切片和取值的习惯用法经常会造成混乱。特别是当显示索引用整数表示时。
在这里插入图片描述
所以 Pandas 提供了一些索引器(indexer)属性来作为取值的方法。它们不是 Series 对象的函数方法,而是暴露切片接口的属性。

  • loc 属性——显式
    在这里插入图片描述
  • iloc 属性—— 隐式
    在这里插入图片描述
  • ix 现已过期

2.DataFrame数据选择方法

1). 将DataFrame看作字典

按照上一节的方法,使用Series对象字典创建DataFrame
在这里插入图片描述

  • 字典形式取列——d[k] --df[name]
  • 属性形式取列 df.name(非字典属性)
    两者等价,避免对用属性形式选择的列直接赋值
    在这里插入图片描述
  • 用字典形式的语法调整对象,比如新增列
    在这里插入图片描述

2). 将DataFrame看作二维数组

用 values 属性按行查看数组数据
在这里插入图片描述
用T方法进行转置
在这里插入图片描述

3). 其他方法和索引器: loc、 iloc和ix

ix已经过期,其余方法取行列总结如下
在这里插入图片描述
这里:是指为筛选的所有行,如果想对行进行筛选,可以替换成条件,如data.loc[data.are>10000,'are']
掩码操作
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章