提供代码运行过程的相关咨询服务,确保代码成功运行。
本文代码已同步更新到,下面公众号。请大家关注公众号 【 Python人生之技术实践】, 近期将推出 豆瓣、知乎、微博、网易云音乐、拉勾网、知网的爬虫教程,代码已经完成,在整理阶段谢谢。
本文以获取大众点评网的店铺评论内容为案例,对爬虫的基本流程进行讲解。
全文共分为:准备工作、爬虫流程、爬虫代码三个部分。
声明:代码仅供学习交流,不能进行商业活动。如有侵权,请联系删帖。
1 准备工作
系统环境:windows 10
编辑器:pycharm, sublime
编程语言:python3.6
1.1 下载谷歌浏览器链接
https://pan.baidu.com/s/1lOKy9951FubKTECAcKVfRg
提取码:56xn
1.2 配置google 浏览器
安装完成后,在chrome浏览输入 chrome://version/ 查看版本号。
如下图 chrome的安装程序:
https://npm.taob