findAll(tag, attributes, recursive, text, limit, keywords)
find(tag, attributes, recursive, text, keywords)
標籤參數tag :傳一個標籤的名稱或多個標籤名稱組成的 Python 列表做標籤參數
屬性參數attributes 是用一個 Python 字典封裝一個標籤的若干屬性和對應的屬性值
遞歸參數 recursive 是一個布爾變量。你想抓取 HTML 文檔標籤結構裏多少層的信息?如果 recursive 設置爲 True ,findAll 就會根據你的要求去查找標籤參數的所有子標籤,以及子標籤的子標籤。如果 recursive 設置爲 False ,findAll 就只查找文檔的一級標籤。findAll 默認是支持遞歸查找的(recursive 默認值是 True );
文本參數 text 用標籤的文本內容去匹配,而不是用標籤的屬性
這只是用來尋找文本比較常用的
- 四種BeautifulSoup對象:
- 導航樹