Pandas的使用1（Series）

原創

2020-06-26 02:24

Pandas是Tensorflow的一个库，提供了一些数据处理的方法。常用的是Series和DataFrame两种数据结构。Series相当于一维数组，与List类似,但功能比List要丰富很多，Series还拥有了Dictionary的很多优点。

下面的程序都在PyCharm的Console中运行,为了方便查看，使用了截图。

1、Pandas的导入,为了方便使用直接导入了Series和DataFrame：

2、简单使用

s1对象的定义使用了列表，这里和列表没有什么不一样。

与List的sort方法类似，Series对于值也有排序方法，Series.sort_values()，但要求元素的类型相同，否则无法比较大小而报错。

不过用下标来索引s3，不会像数组一样改变顺序，且s2不会改变

如果需要像列表一样对数据进行排序，需要使用values属性，下面介绍。

3、与Dictionary的比较使用

Series的另外一个特点就是结合了Dictionary的优点，下标Index可以被指定：

上面没有指定s2的下标，因此默认是从0开始的整数

值得注意的是s2的values和index元素都是List，只是index是只读的。因此可以对values进行排序，下面另外给出一个案例：

如此排序，Series的标签位置不会改变，但值会被排序，在使用中一定要注意。

参考Dictionary，Series的index-value对可以用Dictionary来定义

同样，s4也可以使用del方法来删除元素，并可以直接增加元素，下面删除了aa下标的元素，并增加了dd下标值为oo的元素

字典的in关键词也一样可以使用

4、特殊用法

Pandas为Series增加的功能是其主要亮点。

定义方法2：

该定义方法和字典方法定义完全一样

抽取指定下标的元素：

s5中的“aa”没有被复制。若指定的下标在s5中不存在，对应的值会是NaN

乘法：

若元素都是数值，则每个元素分别做乘法运算

加法：

在s5和s6都存在元素相加，否则值就是NaN

判断值是否NaN有两种形式：

利用下标来筛选数据：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.