scrapy 404 問題 & HTTP status code is not handled or not allowed

背景:在使用scrapy爬取網頁時,當一個頁面的http code是404時,scrapy會略掉它,然而,如果你想在爬蟲裏對http code是404,做特殊處理的時候,就不會應驗。

解決辦法: 在settings 文件裏 加上 :

HTTPERROR_ALLOWED_CODES = [404]
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章