Scrapy-如何同时运行多个爬虫及定时问题

原創

2019-09-08 00:02

同时运行多个爬虫查到的主要有两种方法。第一种是在项目内创建command文件夹，添加改写后的crawl.py文件，并在settings.py进行相关配置实现的，该方法相当于创建了一个自定义的指令，启动多个爬虫时，在cmd命令行中执行新创建的指令即可。详细步骤见这里。第二种方法通过scrapy.crawler.CrawlerProcess实现，本人使用的就是这种方法。

官方文档中，scrapy.crawler.CrawlerProcess的介绍是“A class to run multiple scrapy crawlers in a process simultaneously.”，主要用到两个方法，CrawlerProcess.crawl()和CrawlerProcess.start()，crawl方法根据参数启动一个爬虫，start方法启动一个twisted reactor（scrapy是基于twisted事件驱动网络框架的），该方法会阻塞直到所有爬虫执行完毕。代码如下

process = CrawlerProcess(settings=get_project_settings())

for module_path, module_name, ispkg in pkgutil.iter_modules(spiders.__path__, spiders.__name__ + "."):
    print('module',module_name)

    spider_name = module_name.split('.')[-1]
    print(spider_name)
    process.crawl(spider_name)

process.start()

这里使用了python内置的pkgutil库，遍历spiders文件夹下所有爬虫并启动，最后执行start方法阻塞在这里。

另外在编写定时代码时，出现第一次运行没有问题，但是第二次会报twisted.internet.error.ReactorNotRestartable错误的情况，解决方法之一见这里，即在不同的进程中启动reactor。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

微服务实践Aspire项目发布到远程k8s集群

前提你必須會創建aspire項目，不會的請先看微服務新體驗之Aspire初體驗 Aspirate (Aspir8) Aspirate 是將aspire項目發佈到k8s集羣的工具安裝aspirate dotnet tool install

2024-06-02 14:24:56

微服务实践之使用 Visual Studio 2022 调试Dapr 应用程序

安裝配置相關軟件安裝 PowerShell 7 / Core dotnet tool install --global PowerShell 安裝 Visual Studio 擴展 Microsoft Child Process Deb

2024-06-02 14:24:56

.NET开源、跨平台、使用简单的面部识别库

前言今天給大家分享一個.NET開源（MIT License）、免費、跨平臺（適用於 Windows、MacOS 和 Linux ）、使用簡單的面部識別庫：FaceRecognitionDotNet。項目介紹 FaceRecogniti

2024-06-02 14:21:55

Python 潮流周刊#53：我辈楷模，一个约见诺奖得主，一个成为核心开发者

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-06-02 14:19:15

Terraform管理OpenStack

官方安裝指南 https://developer.hashicorp.com/terraform/install https://developer.hashicorp.com/terraform/intro/getting-sta

2024-06-02 14:13:44

matlab练习程序（LQR路径跟踪）

LQR 是一種優化控制方法，設計目標是找到一組控制輸入，使得線性系統的狀態軌跡儘可能地接近目標，同時使控制輸入儘可能小。其目標函數是一個二次型成本函數。分爲以下幾個步驟： 1. 設系統動態方程爲：其中x爲狀態量，u爲控制輸入，A和B爲

2024-06-02 14:11:04

h32 Most commonly used tags in HTML

Most commonly used tags in HTML Last Updated : 08 Mar, 2024 Most commonly used tags in HTML refer to HTM

2024-06-02 14:10:23

css45 CSS Math Functions

https://www.w3schools.com/css/css_math_functions.asp The CSS math functions allow mathematical expressions to be used

2024-06-02 14:10:23

CSS tutorials (w3school)

CSS tutorials (w3school) https://www.schoolsw3.com/css/index.php (Русский язык) https://www.w3schools.com/css/css_intro

2024-06-02 14:10:23

css44 CSS The !important Rule

https://www.w3schools.com/css/css_important.asp What is !important? The !important rule in CSS is used to add more imp

2024-06-02 14:10:23

css41 CSS Website Layout

https://www.w3schools.com/css/css_website_layout.asp Website Layout A website is often divided into headers, menus, co

2024-06-02 14:10:23

css39 CSS Forms

https://www.w3schools.com/css/css_form.asp The look of an HTML form can be greatly improved with CSS: <!DOCTYPE html>

2024-06-02 14:10:23

css40 CSS Counters

https://www.w3schools.com/css/css_counters.asp CSS counters are "variables" maintained by CSS whose values can be inc

2024-06-02 14:10:23

css43 CSS Specificity

https://zhuanlan.zhihu.com/p/670589063 CSS Specificity(CSS 特異性)是一個用來決定當多個CSS規則應用於同一個元素時,哪個規則將優先應用的機制。 What is Specific

2024-06-02 14:10:23

css42 CSS Units

https://www.w3schools.com/css/css_units.asp CSS Units CSS has several different units for expressing a length. Many CS

2024-06-02 14:10:23

24小時熱門文章

最新文章

最新評論文章