一文弄懂apply、map和applymap三種函數的區別

CDA數據分析師 出品

在日常處理數據的過程中,會經常遇到這樣的情況,對一個DataFrame進行逐行、逐列或者逐元素的操作,很多小夥伴也知道需要用到apply、map或者applymap,但是具體什麼情況下運用哪種方法或者說對這些方法瞭解不夠,用起來暈暈乎乎始終沒有很明白,希望這一篇文章能夠幫助有需要的小夥伴弄懂他們之間的區別,並且在遇到問題的時候能夠很清楚明白用哪個以及該怎樣使用。閒話少敘,我們正式開始吧。

首先,來個總結

· apply:應用在DataFrame的行或列中,也可以應用到單獨一個Series的每個元素中

· map:應用在單獨一個Series的每個元素中

· applymap:應用在DataFrame的每個元素中

apply

先從apply開始,當然最權威的說明還是要看官方文檔:

apply是沿DataFrame的軸應用功能,傳遞給函數的對象是Series對象,其索引爲DataFrame的索引(axis = 0’’)或DataFrame的列(axis = 1’’)

當然最常用的還是DataFrame.apply(),下邊我們通過例子來說明一下幫助理解.

首先有一個表:

apply應用到DataFrame中

如果我們求一下每一列或者每一列的極差,注意axis參數的設置,一般默認爲0,即求每一列的極值

apply的參數可以直接接收現成的函數,也可以接收自定義函數,比如自定義的匿名函數:

通過對軸信息的設置,也可以求每一行的極差:

需要注意的是結果的索引,能夠很明顯的告訴大家現在求的是行極差還是列極差,如果是行極差,索引是行標籤,如果是列極差,索引是列名。

另外,對整個DataFrame運用apply的時候,要保證所有的字段都是符合作爲參數的函數要求纔可以,比如在列子中求極值得保證所有字段都是數值型才行,如果整個DataFrame不能滿足要求,可以把符合要求的字段切出來再應用apply。

如果有需要,也可以把求的結果添加到原表當中。

apply應用到Series中

如這個例子,將A列的所有元素轉換數據類型,從整型轉換成浮點型:

總結一下,apply運用到整個DataFrame中可以執行整列或者整行的運算,運用到Series中,執行的是對每個元素的運算。

這個運算,map也可以實現。

map

首先,還是看下官方文檔是怎麼說的:

· 根據輸入對應關係映射Series的值。

· 用於將Series中的每個值替換爲另一個值,該值可以從函數dict或Series派生。

官方指定,map是應用於Seriesd 的,參數可以是函數也可以字典。

首先,還是要有一個表:

現在需要將性別轉換成0和1,女爲0,男爲1,這個時候千萬不要寫循環啊,map()可以輕鬆實現,先來試試函數的形式:

def gender(x): G = 1 if x == “男” else 0 return G

map的參數除了可以是參數,也可以是字典,這和apply對參數的要求不同:

applymap

最後來看一下applymap,還是先搬上官方文檔:

· 將函數應用於元素的數據框。

· 此方法應用一個函數,該函數接受並返回一個標量到DataFrame的每個元素。

簡單說,applymap是把函數應用到DataFrame中的每個元素上的,要和apply對整列或者整行進行的操作區分開啊,apply想要直接對每個元素進行操作,得單獨提取出Series纔可以實現,不能直接再整個DataFrame上執行。下邊來看個例子。

還是開頭的那個表:

現在要把每個元素的數據類型都轉換成浮點型,applymap()就派上用場了:

最後再總結一下:

apply:

· 既可以用在DataFrame,也可以用到單獨的Series中

· 運用到DataFrame時,是用到了整行或者整列上,不是逐一運用到每個元素上

· 運用到Series時,作用到每個元素上

· 第一個參數只接收python原生函數或者numpy中的函數

map

· 只能運用到Series的每個元素上

· 參數可以是函數也可以是字典,還可以是序列

applymap

· 只能應用在DataFrame中,並且是作用在DataFrame的每個元素中

· 參數只接收可調用的函數

常用的用法呢就是前邊舉的例子中的那些了,希望這邊文章能幫助大家分清apply、map和applymap並能靈活運用它們。

疫情當下,昔日匆匆的步伐終於放慢了些,也是時候好好想想自己的職業計劃和人生規劃了。提前做好準備,未雨綢繆,爲未來蓄能——蓄勢待發!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章