scrapy在start_requests中傳入參數給parser

scrapy在start_requests中發出請求時,需要傳入一些參數進行動態控制。爲保證scrapy的請求的併發性,將其改爲串行執行顯然嚴重影響效率,因此不考慮採用全局變量的方法。因此可以使用在scrapy.Request中加入meta數據的方式向parse傳入參數,如下代碼的請求中加入了meta元素,包含regionId字段,可在parse中解析到

    def start_requests(self):
    	urlTemp='http://www.baidu.com'
        urls = [urlTemp]
        for url in urls:
            yield scrapy.Request(url=url, meta={'regionId': 0}, callback=self.parse)

    def parse(self, response):
        print(response.meta['regionId'])
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章