迭代器設計模式，幫你大幅提升Python性能

原創

TechFlow2019

2021-01-03 13:28

大家好，我們的git專題已經更新結束了，所以開始繼續給大家寫一點設計模式的內容。

今天給大家介紹的設計模式非常簡單，叫做iterator，也就是迭代器模式。迭代器是Python語言當中一個非常重要的內容，藉助迭代器我們可以很方便地實現很多複雜的功能。在深度學習當中，數據的獲取往往也是通過迭代器實現的。因此這部分的內容非常重要，推薦大家一定要掌握。

簡單案例

在開始介紹設計模式之前，我們先來看一個簡單的需求。假設現在我們需要根據傳入的變量獲取每週的前幾天，比如說我們傳入3返回的就是[Mon, Tue, Wed]，我們傳入5返回[Mon, Tue, Wed, Thu, Fri]。這個需求大家應該都能理解，非常非常簡單。

如果用一個函數來實現的話，就是這樣：

def return_days(n):
    week = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']
    return week[:n]

你看三行代碼就實現了，在這個問題場景當中這樣寫當然是沒有問題。但假如我們把題目稍微變一變，這裏的week不是一個固定的數據，而是從上游或者是某個文件當中讀取的。這裏的n也是一個很大的數，我們把這個函數改寫成這樣：

def get_data(n):
    data = []
    for i in range(n):
        data.append(get_from_upstream())
    return data

我們假設get_from_upstream這個函數當中實現了獲取數據的具體邏輯，那麼上面這一段函數有一個什麼問題？

有些同學會說這沒有問題啊，因爲像是其他語言實現數據獲取的時候也都是這麼幹的。的確，像是Java等語言可能都是這麼幹的。但是其他語言這麼幹沒錯，不代表Python這麼幹也沒錯。因爲我們沒有把Python的能力發揮到最大。

這裏有兩個問題，第一個問題是延遲，因爲前面說了，n是一個很大的數。我們從上游獲取數據，無論是通過網絡還是文件讀取，本質上都是IO操作，IO操作的延遲是非常大的。那麼我們把這n條數據全部蒐集完可能需要很長的時間，導致下游的漫長等待。第二個問題就是內存，因爲我們存儲了這n條數據一起返回的，如果n很大，對於內存的開銷壓力也很大，如果機器內存不夠很有可能導致崩潰。

那怎麼解決呢？

其實解決的方法很簡單，如果對迭代器熟悉的話，會發現迭代器針對的恰恰是這兩個問題。我們把上面的邏輯改寫成迭代器實現即可，這也就是iterator模式。

iterator模式

iterator模式嚴格說起來其實只是迭代器的一種應用，它非常巧妙地將迭代器與匿名函數結合在一起，裏面也沒有太多的門道可以說，我們把剛纔的代碼改寫一下，細節都在代碼當中。

def get_data(n):
    for i in range(n):
  yield get_from_upstream()


data_10 = lambda: get_data(10)
data_100 = lambda: get_data(100)

# use
for d in data_10:
    print(d)

很簡單吧，但可能你要問了，我們既然寫出了get_data這個迭代器，那麼我們使用的時候直接for d in get_data(10)這樣用不就好了，爲什麼中間要用匿名函數包一層呢？

道理也很簡單，如果這個數據是我們自己使用，當然是沒必要中間包一層的。但如果我們是傳給下游使用的話，對於下游來說它肯定是不希望考慮上游太多的細節的，越簡單越好。所以我們直接丟一個包裝好的迭代器過去，下游直接call即可。否則的話，下游還需要感知get_data這個函數傳入的參數，顯然是不夠合理的。

今天的文章就到這裏，衷心祝願大家每天都有所收穫。如果還喜歡今天的內容的話，請來一個三連支持吧~（點贊、關注、轉發）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

迭代器設計模式，幫你大幅提升Python性能

簡單案例

iterator模式

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

Java ThreadPoolShutdown

“她”來了，陪伴賽道鉅變！爲GPT-4o加上你的一個數字分身

京東秒送售後系統退款業務重構心得| 京東零售技術團隊

核心技巧！如何應對面試筆試環節中的算法題？

大數據殺熟？那分明是滴滴最後的希望

金三銀四跳槽季，請離獵頭遠一點

設計模式——把類作爲參數的抽象工廠模式

只要五分鐘，帶你學會策略模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結