刨根問底:對象也可以當方法用?

1、問題

我剛開始接觸爬蟲的時候,只是看完了 python 的基礎,對 python 的語法還沒有一個很深入的瞭解,在使用 bs4 這個庫的時候,對其中某些語法感到非常的驚奇,不明白是怎麼實現的。

bs4 的官方文檔中說到:find_all() 幾乎是 Beautiful Soup 中最常用的搜索方法,所以我們定義了它的簡寫方法。BeautifulSoup 對象和 tag 對象可以被當作一個方法來使用,這個方法的執行結果與調用這個對象的 find_all() 方法相同,下面兩行代碼是等價的:

soup.find_all("a")
soup("a")

這裏,soup 是一個 BeautifulSoup 對象,soup("a") 這很明顯是把對象當方法使用了,這是怎麼做到的呢?

2、實現

在 Python 中,除了用戶定義的函數,調用運算符(即 ())還可以應用到其他對象上。內置的 callable() 函數用來判斷一個對象能否調用。就是說,任何 Python 對象都可以表現得像函數一樣,爲此,只需實現實例方法 __call__

來看一個簡單的示例:

class Sum:
    def __init__(self, x, y):
        self._x = x
        self._y = y

    def add(self):
        return self._x + self._y

    def __call__(self):
        return self.add()


sum = Sum(12)

print(sum.add())
print(sum())
print(callable(sum))

輸出:

3
3
True

這樣就明白了,bs4 中亦是如此,源碼如下:

class Tag(PageElement):
    def __call__(self, *args, **kwargs):
        return self.find_all(*args, **kwargs)

這背後涉及到的概念叫做可調用對象,Python 數據模型文檔列出了 7 種可調用對象。

  • 用戶定義的函數:使用 def 語句或 lambda 表達式創建。
  • 內置函數:使用 C 語言(CPython)實現的函數,如 len 或 time.strftime。
  • 內置方法:使用 C 語言實現的方法,如 dict.get。
  • 方法:在類的定義體中定義的函數。
  • :調用類時會運行類的 __new__ 方法創建一個實例,然後運行 __init__ 方法,初始化實例,最後把實例返回給調用方。因爲 Python 沒有 new 運算符,所以調用類相當於調用函數。(通常,調用類會創建那個類的實例,不過覆蓋 __new__ 方法的話,也可能出現其他行爲。)
  • 類的實例:如果類定義了 __call__ 方法,那麼它的實例可以作爲函數調用。
  • 生成器函數:使用 yield 關鍵字的函數或方法。調用生成器函數返回的是生成器對象。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章