网络爬虫之框架 5-1 Scrapy爬虫框架

文章截图均来自中国大学mooc Python网络爬虫与信息提取的教程,以上仅作为我的个人学习笔记。下面是教程链接:

https://www.icourse163.org/learn/BIT-1001870001?tid=1450316449#/learn/content?type=detail&id=1214620493&cid=1218397635&replay=true


Scrapy爬虫框架介绍:

使用:pip install srcapy 进行安装

安装后小测:执行 scrapy -h

Scrapy不是一个简单的函数功能库,而是一个爬虫框架

爬虫框架:

  • 是实现爬虫功能的一个软件结构和功能组件的集合
  • 爬虫框架是一个半成品,可以帮助用户实现专业网络爬虫

Scrapy爬虫框架的内容:5+2结构

Scrapy爬虫框架的解析:

Requests和Scrapy的比较:

      

选择角度:

Scrapy爬虫的常用命令:

为什么Scrapy爬虫框架为什么采用命令行创建和运行爬虫:

单元小结:

5+2结构

三个数据流的路径

和Requests库的不同与择优

命令行

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章