Python：多進程傳參missing 1 required positional argument

原創

BBJG_001

2020-03-09 21:50

問題引出

許多時候，我們對程序的速度都是有要求的，速度自然是越快越好。對於Python的話，一般都是使用multiprocessing這個庫來實現程序的多進程化，例如：

我們有一個函數my_print，它的作用是打印我們的輸入：

def my_print(x):
    print(x)

但是我們嫌它的速度太慢了，因此我們要將這個程序多進程化：

from multiprocessing import Pool
 
def my_print(x):
    print(x)
 
if __name__ == "__main__":
    x = [1, 2, 3, 4, 5]
    pool = Pool()
    pool.map(my_print, x)
    pool.close()
    pool.join()

很好，現在速度與之前的單進程相比提升非常的快，但是問題來了，如果我們的參數不只有一個x，而是有多個，這樣能行嗎？比如現在my_print新增一個參數y：

def my_print(x, y):
    print(x + y)

查看pool.map的函數說明：

def map(self, func, iterable, chunksize=None):
    '''
    Apply `func` to each element in `iterable`, collecting the results
    in a list that is returned.
    '''
    return self._map_async(func, iterable, mapstar, chunksize).get()

發現函數的參數是作爲iter傳進去的，但是我們現在有兩個參數，自然想到使用zip將參數進行打包：

if __name__ == "__main__":
    x = [1, 2, 3, 4, 5]
    y = [1, 1, 1, 1, 1]
    zip_args = list(zip(x, y))
    pool = Pool()
    pool.map(my_print, zip_args)
    pool.close()
    pool.join()

可是執行後卻發現，y參數並沒有被傳進去：

那麼如何傳入多個參數呢？這也就是本文的重點，接着往下看吧。

解決方案

2.1 使用偏函數（partial）
偏函數有點像數學中的偏導數，可以讓我們只關注其中的某一個變量而不考慮其他變量的影響。上面的例子中，Y始終等於1，那麼我們在傳入參數的時候，只需要考慮X的變化即可。例如你有一個函數，該函數有兩個參數a,b，a是不同路徑的下的圖片的路徑，b是輸出的路徑。很明顯，a是一直在變化的，但是因爲我們要將所有圖片保存在同一個文件夾下，那麼b很可能一直都沒變。具體如下：

if __name__ == '__main__':# 多線程，多參數，partial版本
    x = [1, 2, 3, 4, 5]
    y = 1
 
    partial_func = partial(my_print, y=y)
    pool = Pool()
    pool.map(partial_func, x)
    pool.close()
    pool.join()

2.2 使用可變參數
在Python函數中，函數可以定義可變參數。顧名思義，可變參數就是傳入的參數個數是可變的，可以是1個、2個到任意個，這就直接給我們提供了一種思路。具體如下：

def multi_wrapper(args):
   return my_print(*args)
 
def my_print(x, y):
    print(x + y)
if __name__ == "__main__": # 多線程，多參數，可變參數版本
    x = [1, 2, 3, 4, 5]
    y = [1, 1, 1, 1, 1]
    zip_args = list(zip(x, y))
 
    pool = Pool()
    pool.map(multi_wrapper, zip_args)
    pool.close()
    pool.join()

2.3 使用pathos提供的多進程庫

from pathos.multiprocessing import ProcessingPool as newPool
 
if __name__ == '__main__':# 多線程，多參數，pathos版本
    x = [1, 2, 3, 4, 5]
    y = [1, 1, 1, 1, 1]
 
    pool = newPool()
    pool.map(my_print, x, y)
    pool.close()
    pool.join()

在該庫的map函數下，可以看到，它允許多參數輸入，其實也就是使用了可變參數：

def map(self, f, *args, **kwds):
    AbstractWorkerPool._AbstractWorkerPool__map(self, f, *args, **kwds)
    _pool = self._serve()
    return _pool.map(star(f), zip(*args)) # chunksize

2.4 使用starmap函數

if __name__ == '__main__': # 多線程，多參數，starmap版本
    x = [1, 2, 3, 4, 5]
    y = [1, 1, 1, 1, 1]
 
    zip_args = list(zip(x, y))
    pool = Pool()
    pool.starmap(my_print, zip_args)
    pool.close()
    pool.join()

總結

其實在以上4種實現方法中，第1種方法的限制較多，如果該函數的其它參數都在變化的話，那麼它就不能很好地工作，而剩下的方法從體驗上來講是依次遞增的，它們都可以接受任意多參數的輸入，但是第2種需要額外寫一個函數，扣分；第3種方法需要額外安裝pathos包，扣分；而最後一種方法不需要任何額外不擇就可以完成，所以，推薦大家選擇第4種方法！

————————————————
版權聲明：本文爲CSDN博主「Jayce~」的原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處鏈接及本聲明。
原文鏈接：https://blog.csdn.net/qq_15969343/article/details/84672527

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Python：多進程傳參missing 1 required positional argument

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

only size-1 arrays can be converted to Python scalars

數據結構筆記：二分查找

強化學習：DQN的理解

tkinter製作菜單欄

tkinter中的Entry和Text應用實例

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結