Pandas的使用1（Series）

原創

2020-06-26 02:24

Pandas是Tensorflow的一個庫，提供了一些數據處理的方法。常用的是Series和DataFrame兩種數據結構。Series相當於一維數組，與List類似,但功能比List要豐富很多，Series還擁有了Dictionary的很多優點。

下面的程序都在PyCharm的Console中運行,爲了方便查看，使用了截圖。

1、Pandas的導入,爲了方便使用直接導入了Series和DataFrame：

2、簡單使用

s1對象的定義使用了列表，這裏和列表沒有什麼不一樣。

與List的sort方法類似，Series對於值也有排序方法，Series.sort_values()，但要求元素的類型相同，否則無法比較大小而報錯。

不過用下標來索引s3，不會像數組一樣改變順序，且s2不會改變

如果需要像列表一樣對數據進行排序，需要使用values屬性，下面介紹。

3、與Dictionary的比較使用

Series的另外一個特點就是結合了Dictionary的優點，下標Index可以被指定：

上面沒有指定s2的下標，因此默認是從0開始的整數

值得注意的是s2的values和index元素都是List，只是index是隻讀的。因此可以對values進行排序，下面另外給出一個案例：

如此排序，Series的標籤位置不會改變，但值會被排序，在使用中一定要注意。

參考Dictionary，Series的index-value對可以用Dictionary來定義

同樣，s4也可以使用del方法來刪除元素，並可以直接增加元素，下面刪除了aa下標的元素，並增加了dd下標值爲oo的元素

字典的in關鍵詞也一樣可以使用

4、特殊用法

Pandas爲Series增加的功能是其主要亮點。

定義方法2：

該定義方法和字典方法定義完全一樣

抽取指定下標的元素：

s5中的“aa”沒有被複制。若指定的下標在s5中不存在，對應的值會是NaN

乘法：

若元素都是數值，則每個元素分別做乘法運算

加法：

在s5和s6都存在元素相加，否則值就是NaN

判斷值是否NaN有兩種形式：

利用下標來篩選數據：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.