Python函數式編程指南(二):函數

Python函數式編程指南(二):函數

這是此係列的第二篇,試圖說明在Python中如何更好地使用函數並引導諸位使用函數式的思維進行思考。掌握並應用這些內容,就已經是至少形似的函數式風格的代碼了,至於思維麼,這個真靠自己。

作者水平有限,如有錯漏之處還請指出;轉載請註明原作者和原地址:)

2. 從函數開始

2.1. 定義一個函數

如下定義了一個求和函數:

1
2
def add(x, y):
    return x + y

關於參數和返回值的語法細節可以參考其他文檔,這裏就略過了。

使用lambda可以定義簡單的單行匿名函數。lambda的語法是:

1
lambda args: expression

參數(args)的語法與普通函數一樣,同時表達式(expression)的值就是匿名函數調用的返回值;而lambda表達式返回這個匿名函數。如果我們給匿名函數取個名字,就像這樣:

1
lambda_add = lambda x, y: x + y

這與使用def定義的求和函數完全一樣,可以使用lambda_add作爲函數名進行調用。然而,提供lambda的目的是爲了編寫偶爾爲之的、簡單的、可預見不會被修改的匿名函數。這種風格雖然看起來很酷,但並不是一個好主意,特別是當某一天需要對它進行擴充,再也無法用一個表達式寫完時。如果一開始就需要給函數命名,應該始終使用def關鍵字。

2.2. 使用函數賦值

事實上你已經見過了,上一節中我們將lambda表達式賦值給了add。同樣,使用def定義的函數也可以賦值,相當於爲函數取了一個別名,並且可以使用這個別名調用函數:

1
2
add_a_number_to_another_one_by_using_plus_operator = add
print add_a_number_to_another_one_by_using_plus_operator(1, 2)

既然函數可以被變量引用,那麼將函數作爲參數和返回值就是很尋常的做法了。

2.3. 閉包

閉包是一類特殊的函數。如果一個函數定義在另一個函數的作用域中,並且函數中引用了外部函數的局部變量,那麼這個函數就是一個閉包。下面的代碼定義了一個閉包:

1
2
3
4
5
6
7
def f():
    n = 1
    def inner():
        print n
    inner()
    n = 'x'
    inner()

函數inner定義在f的作用域中,並且在inner中使用了f中的局部變量n,這就構成了一個閉包。閉包綁定了外部的變量,所以調用函數f的結果是打印1和'x'。這類似於普通的模塊函數和模塊中定義的全局變量的關係:修改外部變量能影響內部作用域中的值,而在內部作用域中定義同名變量則將遮蔽(隱藏)外部變量。

如果需要在函數中修改全局變量,可以使用關鍵字global修飾變量名。Python 2.x中沒有關鍵字爲在閉包中修改外部變量提供支持,在3.x中,關鍵字nonlocal可以做到這一點:

1
2
3
4
5
6
7
8
9
#Python 3.x supports `nonlocal'
def f():
    n = 1
    def inner():
        nonlocal n
        n = 'x'
    print(n)
    inner()
    print(n)

調用這個函數的結果是打印1和'x',如果你有一個Python 3.x的解釋器,可以試着運行一下。

由於使用了函數體外定義的變量,看起來閉包似乎違反了函數式風格的規則即不依賴外部狀態。但是由於閉包綁定的是外部函數的局部變量,而一旦離開外部函數作用域,這些局部變量將無法再從外部訪問;另外閉包還有一個重要的特性,每次執行至閉包定義處時都會構造一個新的閉包,這個特性使得舊的閉包綁定的變量不會隨第二次調用外部函數而更改。所以閉包實際上不會被外部狀態影響,完全符合函數式風格的要求。(這裏有一個特例,Python 3.x中,如果同一個作用域中定義了兩個閉包,由於可以修改外部變量,他們可以相互影響。)

雖然閉包只有在作爲參數和返回值時才能發揮它的真正威力,但閉包的支持仍然大大提升了生產率。

2.4. 作爲參數

如果你對OOP的模板方法模式很熟悉,相信你能很快速地學會將函數當作參數傳遞。兩者大體是一致的,只是在這裏,我們傳遞的是函數本身而不再是實現了某個接口的對象。 
我們先來給前面定義的求和函數add熱熱身:

1
print add('三角形的樹', '北極')

與加法運算符不同,你一定很驚訝於答案是'三角函數'。這是一個內置的彩蛋...bazinga!

言歸正傳。我們的客戶有一個從0到4的列表:

1
lst = range(5) #[0, 1, 2, 3, 4]

雖然我們在上一小節裏給了他一個加法器,但現在他仍然在爲如何計算這個列表所有元素的和而苦惱。當然,對我們而言這個任務輕鬆極了:

1
2
3
amount = 0
for num in lst:
    amount = add(amount, num)

這是一段典型的指令式風格的代碼,一點問題都沒有,肯定可以得到正確的結果。現在,讓我們試着用函數式的風格重構一下。

首先可以預見的是求和這個動作是非常常見的,如果我們把這個動作抽象成一個單獨的函數,以後需要對另一個列表求和時,就不必再寫一遍這個套路了:

1
2
3
4
5
6
7
def sum_(lst):
    amount = 0
    for num in lst:
        amount = add(amount, num)
    return amount
 
print sum_(lst)

還能繼續。sum_函數定義了這樣一種流程: 
1. 使用初始值與列表的第一個元素相加; 
2. 使用上一次相加的結果與列表的下一個元素相加; 
3. 重複第二步,直到列表中沒有更多元素; 
4. 將最後一次相加的結果返回。

如果現在需要求乘積,我們可以寫出類似的流程——只需要把相加換成相乘就可以了:

1
2
3
4
5
def multiply(lst):
    product = 1
    for num in lst:
        product = product * num
    return product

除了初始值換成了1以及函數add換成了乘法運算符,其他的代碼全部都是冗餘的。我們爲什麼不把這個流程抽象出來,而將加法、乘法或者其他的函數作爲參數傳入呢?

1
2
3
4
5
6
7
def reduce_(function, lst, initial):
    result = initial
    for num in lst:
        result = function(result, num)
    return result
 
print reduce_(add, lst, 0)

現在,想要算出乘積,可以這樣做:

1
print reduce_(lambda x, y: x * y, lst, 1)

那麼,如果想要利用reduce_找出列表中的最大值,應該怎麼做呢?請自行思考:)

雖然有模板方法這樣的設計模式,但那樣的複雜度往往使人們更情願到處編寫循環。將函數作爲參數完全避開了模板方法的複雜度。

Python有一個內建函數reduce,完整實現並擴展了reduce_的功能。本文稍後的部分包含了有用的內建函數的介紹。請注意我們的目的是沒有循環,使用函數替代循環是函數式風格區別於指令式風格的最顯而易見的特徵。

*像Python這樣構建於類C語言之上的函數式語言,由於語言本身提供了編寫循環代碼的能力,內置函數雖然提供函數式編程的接口,但一般在內部還是使用循環實現的。同樣的,如果發現內建函數無法滿足你的循環需求,不妨也封裝它,並提供一個接口。

2.5. 作爲返回值

將函數返回通常需要與閉包一起使用(即返回一個閉包)才能發揮威力。我們先看一個函數的定義:

1
2
3
4
5
def map_(function, lst):
    result = []
    for item in lst:
        result.append(function(item))
    return result

函數map_封裝了最常見的一種迭代:對列表中的每個元素調用一個函數。map_需要一個函數參數,並將每次調用的結果保存在一個列表中返回。這是指令式的做法,當你知道了列表解析(list comprehension)後,會有更好的實現。

這裏我們先略過map_的蹩腳實現而只關注它的功能。對於上一節中的lst,你可能發現最後求乘積結果始終是0,因爲lst中包含了0。爲了讓結果看起來足夠大,我們來使用map_爲lst中的每個元素加1:

1
2
lst = map_(lambda x: add(1, x), lst)
print reduce_(lambda x, y: x * y, lst, 1)

答案是120,這還遠遠不夠大。再來:

1
2
lst = map_(lambda x: add(10, x), lst)
print reduce_(lambda x, y: x * y, lst, 1)

囧,事實上我真的沒有想到答案會是360360,我發誓沒有收周鴻禕任何好處。

現在回頭看看我們寫的兩個lambda表達式:相似度超過90%,絕對可以使用抄襲來形容。而問題不在於抄襲,在於多寫了很多字符有木有?如果有一個函數,根據你指定的左操作數,能生成一個加法函數,用起來就像這樣:

1
lst = map_(add_to(10), lst) #add_to(10)返回一個函數,這個函數接受一個參數並加上10後返回

寫起來應該會舒服不少。下面是函數add_to的實現:

1
2
def add_to(n):
    return lambda x: add(n, x)

通過爲已經存在的某個函數指定數個參數,生成一個新的函數,這個函數只需要傳入剩餘未指定的參數就能實現原函數的全部功能,這被稱爲偏函數。Python內置的functools模塊提供了一個函數partial,可以爲任意函數生成偏函數:

1
functools.partial(func[, *args][, **keywords])

你需要指定要生成偏函數的函數、並且指定數個參數或者命名參數,然後partial將返回這個偏函數;不過嚴格的說partial返回的不是函數,而是一個像函數一樣可直接調用的對象,當然,這不會影響它的功能。

另外一個特殊的例子是裝飾器。裝飾器用於增強甚至乾脆改變原函數的功能,我曾寫過一篇文檔介紹裝飾器,地址在這裏:http://www.cnblogs.com/huxi/archive/2011/03/01/1967600.html

*題外話,單就例子中的這個功能而言,在一些其他的函數式語言中(例如Scala)可以使用名爲柯里化(Currying)的技術實現得更優雅。柯里化是把接受多個參數的函數變換成接受一個單一參數(最初函數的第一個參數)的函數,並且返回接受餘下的參數而且返回結果的新函數的技術。如下的僞代碼所示:

1
2
3
4
5
#不是真實的代碼
def add(x)(y): #柯里化
    return x + y
 
lst = map_(add(10), lst)

通過將add函數柯里化,使得add接受第一個參數x,並返回一個接受第二個參數y的函數,調用該函數與前文中的add_to完全相同(返回x + y),且不再需要定義add_to。看上去是不是更加清爽呢?遺憾的是Python並不支持柯里化。

2.6. 部分內建函數介紹
  • reduce(function, iterable[, initializer]) 
    這個函數的主要功能與我們定義的reduce_相同。需要補充兩點: 
    它的第二個參數可以是任何可迭代的對象(實現了__iter__()方法的對象); 
    如果不指定第三個參數,則第一次調用function將使用iterable的前兩個元素作爲參數。 
    由reduce和一些常見的function組合成了下面列出來的內置函數:
    1
    2
    3
    4
    5
    all(iterable) == reduce(lambda x, y: bool(x and y), iterable)
    any(iterable) == reduce(lambda x, y: bool(x or y), iterable)
    max(iterable[, args...][, key]) == reduce(lambda x, y: x if key(x) > key(y) else y, iterable_and_args)
    min(iterable[, args...][, key]) == reduce(lambda x, y: x if key(x) < key(y) else y, iterable_and_args)
    sum(iterable[, start]) == reduce(lambda x, y: x + y, iterable, start)
  • map(function, iterable, ...) 
    這個函數的主要功能與我們定義的map_相同。需要補充一點: 
    map還可以接受多個iterable作爲參數,在第n次調用function時,將使用iterable1[n], iterable2[n], ...作爲參數。
  • filter(function, iterable) 
    這個函數的功能是過濾出iterable中所有以元素自身作爲參數調用function時返回True或bool(返回值)爲True的元素並以列表返回,與系列第一篇中的my_filter函數相同。
  • zip(iterable1, iterable2, ...) 
    這個函數返回一個列表,每個元素都是一個元組,包含(iterable1[n], iterable2[n], ...)。 
    例如:zip([1, 2], [3, 4]) --> [(1, 3), (2, 4)] 
    如果參數的長度不一致,將在最短的序列結束時結束;如果不提供參數,將返回空列表。

除此之外,你還可以使用本文2.5節中提到的functools.partial()爲這些內置函數創建常用的偏函數。

另外,pypi上有一個名爲functional的模塊,除了這些內建函數外,還額外提供了更多的有意思的函數。但由於使用的場合並不多,並且需要額外安裝,在本文中就不介紹了。但我仍然推薦大家下載這個模塊的純Python實現的源代碼看看,開闊思維嘛。裏面的函數都非常短,源文件總共只有300行不到,地址在這裏:http://pypi.python.org/pypi/functional

此篇結束:)

分類: Python


轉自:http://www.cnblogs.com/huxi/archive/2011/06/24/2089358.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章