1. 最基本的有三種解析器。
默認爲 html.parser。
官方文檔推薦 lxml(解析速度快,但遇到 </html> 則終止,無法解析其後內容,與 urlopen 配合使用可解決,但仍存在解析不完全的情況)。
官方文檔推薦 html5lib(解析最全,但速度極慢,大約是 lxml 解析速度的 4 到 5 倍)。2. 參考文檔,關於BeautifulSoup4 解析器的說明。
1. 最基本的有三種解析器。
默認爲 html.parser。
官方文檔推薦 lxml(解析速度快,但遇到 </html> 則終止,無法解析其後內容,與 urlopen 配合使用可解決,但仍存在解析不完全的情況)。
官方文檔推薦 html5lib(解析最全,但速度極慢,大約是 lxml 解析速度的 4 到 5 倍)。2. 參考文檔,關於BeautifulSoup4 解析器的說明。