BeautifulSoup4 解析器的說明

1. 最基本的有三種解析器。

    默認爲 html.parser。

    官方文檔推薦 lxml(解析速度快,但遇到 </html> 則終止,無法解析其後內容,與 urlopen 配合使用可解決,但仍存在解析不完全的情況)。

    官方文檔推薦 html5lib(解析最全,但速度極慢,大約是 lxml 解析速度的 4 到 5 倍)。2. 參考文檔,關於BeautifulSoup4 解析器的說明

                                                                

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章