Cython,一個簡化 Python 編寫 C 擴展的語言

Python 是當今使用最多的流行編程語言之一,因爲:它是開源的,它有廣泛的用途(例如 Web 編程、業務應用、遊戲、科學編程等等),它有一個充滿活力和專注的社區支持它。這個社區可以讓我們在 Python Package Index(PyPI)中有如此龐大、多樣化的軟件包,用以擴展和改進 Python 並解決不可避免的問題。

在本系列中,我們將介紹七個可以幫助你解決常見 Python 問題的 PyPI 庫。首先是 Cython,一個簡化 Python 編寫 C 擴展的語言。

Cython
使用 Python 很有趣,但有時,用它編寫的程序可能很慢。所有的運行時動態調度會帶來很大的代價:有時它比用 C 或 Rust 等系統語言編寫的等效代碼慢 10 倍。

將代碼遷移到一種全新的語言可能會在成本和可靠性方面付出巨大代價:所有的手工重寫工作都將不可避免地引入錯誤。我們可以兩者兼得麼?

爲了練習一下優化,我們需要一些慢代碼。有什麼比斐波那契數列的意外指數實現更慢?

def fib(n):
if n < 2:
return 1
return fib(n-1) + fib(n-2)
由於對 fib 的調用會導致兩次再次調用,因此這種效率極低的算法需要很長時間才能執行。例如,在我的新筆記本電腦上,fib(36) 需要大約 4.5 秒。這個 4.5 秒會成爲我們探索 Python 的 Cython 擴展能提供的幫助的基準。

使用 Cython 的正確方法是將其集成到 setup.py 中。然而,使用 pyximport 可以快速地進行嘗試。讓我們將 fib 代碼放在 fib.pyx 中並使用 Cython 運行它。

import pyximport; pyximport.install()
import fib
fib.fib(36)
只使用 Cython 而不修改代碼,這個算法在我筆記本上花費的時間減少到大約 2.5 秒。幾乎無需任何努力,這幾乎減少了 50% 的運行時間。當然,得到了一個不錯的成果。

加把勁,我們可以讓它變得更快。

cpdef int fib(int n):
if n < 2:
return 1
return fib(n - 1) + fib(n - 2)
我們將 fib 中的代碼變成用 cpdef 定義的函數,並添加了兩個類型註釋:它接受一個整數並返回一個整數。

這個變得快多了,大約只用了 0.05 秒。它是如此之快,以至於我可能開始懷疑我的測量方法包含噪聲:之前,這種噪聲在信號中丟失了。

當下次你的 Python 代碼花費太多 CPU 時間時,也許會導致風扇狂轉,爲何不看看 Cython 是否可以解決問題呢?

在本系列的下一篇文章中,我們將看一下 Black,一個自動糾正代碼格式錯誤的項目。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章