文章目錄
四、Pandas數值運算方法
1.通用函數: 保留索引
因爲 Pandas 是建立在 NumPy 基礎之上的,所以 NumPy 的通用函數同樣適用於 Pandas 的Series 和 DataFrame 對象。
使用 NumPy 通用函數,生成的結果是另一個保留索引的Pandas 對象
2.通用函數: 索引對齊
1). Series索引對齊
Pandas 會在計算過程中對齊兩個對象的索引。
當要運算的數據有缺失時結果會輸出並集,但只計算交集部分,其餘部分會用NaN填充
如果用 NaN 值不是我們想要的結果,那麼可以用適當的對象方法代替運算符。
2). DataFrame索引對齊
與Series類似
Python運算符與Pandas方法的映射關係
Python運算符 | Pandas方法 |
---|---|
+ | add() |
- | sub()、 subtract() |
* | mul()、 multiply() |
/ | truediv()、 div()、 divide() |
// | floordiv() |
% | mod() |
** | pow() |
3.通用函數: DataFrame與Series的運算
DataFrame 和 Series 的運算規則,與 NumPy 中二維數組與一維數組的運算規則是一樣的。
一個二維數組減去自身的一行數據,默認按行運算的
在 Pandas 裏默認也是按行運算的
DataFrame / Series 的運算與前面介紹的運算一樣,結果的索引都會自動對齊
這些行列索引的保留與對齊方法說明 Pandas 在運算時會一直保存這些數據內容,從而避免在處理數據類型有差異和 / 或維度不一致的 NumPy 數組時可能遇到的問題。