(轉)關於Python中的yield

在介紹yield前有必要先說明下Python中的迭代器(iterator)和生成器(constructor)。

一、迭代器(iterator)

在Python中,for循環可以用於Python中的任何類型,包括列表、元祖等等,實際上,for循環可用於任何“可迭代對象”,這其實就是迭代器

迭代器是一個實現了迭代器協議的對象,Python中的迭代器協議就是有next方法的對象會前進到下一結果,而在一系列結果的末尾是,則會引發 StopIteration。任何這類的對象在Python中都可以用for循環或其他遍歷工具迭代,迭代工具內部會在每次迭代時調用next方法,並且 捕捉StopIteration異常來確定何時離開。

使用迭代器一個顯而易見的好處就是:每次只從對象中讀取一條數據,不會造成內存的過大開銷。

比如要逐行讀取一個文件的內容,利用readlines()方法,我們可以這麼寫:

for line in open("test.txt").readlines():
    print line 

這樣雖然可以工作,但不是最好的方法。因爲他實際上是把文件一次加載到內存中,然後逐行打印。當文件很大時,這個方法的內存開銷就很大了。

利用file的迭代器,我們可以這樣寫:

for line in open("test.txt"):   #use file iterators
    print line 

這是最簡單也是運行速度最快的寫法,他並沒顯式的讀取文件,而是利用迭代器每次讀取下一行。

二、生成器(constructor)

生成器函數在Python中與迭代器協議的概念聯繫在一起。簡而言之,包含yield語句的函數會被特地編譯成生成器。當函數被調用時,他們返回一個生成器對象,這個對象支持迭代器接口。函數也許會有個return語句,但它的作用是用來yield產生值的。

不像一般的函數會生成值後退出,生成器函數在生成值後會自動掛起並暫停他們的執行和狀態,他的本地變量將保存狀態信息,這些信息在函數恢復時將再度有效

>>> def g(n):
...     for i in range(n):
...             yield i **2
...
>>> for i in g(5):
...     print i,":",
...
0 : 1 : 4 : 9 : 16 : 

要了解他的運行原理,我們來用next方法看看:

>>> t = g(5)
>>> t.next()
0
>>> t.next()
1
>>> t.next()
4
>>> t.next()
9
>>> t.next()
16
>>> t.next()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration 

在運行完5次next之後,生成器拋出了一個StopIteration異常,迭代終止。
再來看一個yield的例子,用生成器生成一個Fibonacci數列:

def fab(max):
    a,b = 0,1
    while a < max:
        yield a
        a, b = b, a+b
 
>>> for i in fab(20):
...     print i,",",
...
0 , 1 , 1 , 2 , 3 , 5 , 8 , 13 , 

看到這裏應該就能理解生成器那個很抽象的概念了吧~~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章