使用Scrapy 提取器
設置好規則
rules = (
Rule(LinkExtractor(allow=r'type=4&page=\d+'), callback="parse_pages", follow=True)
)
報了一個的錯誤,源碼來看是要求爲可迭代對象,加個逗號就行,
Rule(LinkExtractor(allow='page='),callback='parse_item',follow=False),
******************************************************************************************************
修改一下, 看了下源碼,該rules需要可迭代對象, 故此處可以爲元組或者列表也行