毕业论文 百度指数采集

本人读旅游专业硕士,2016年毕业。本人喜欢游泳也需喜欢自己的专业,因此毕业论文课题是《湖北省近十年旅游业发展分析》。

按照度娘的官方介绍,百度指数是以百度网页搜索和百度新闻搜索为基础的免费海量数据分析服务,能反映关键词在过去一段时间内的网络曝光率及用户关注度!
 

百度采集工具: 灵动百度数据采集。

百度指数采集工具:
https://item.taobao.com/item.htm?id=545046986518    

 

通过各种渠道了解湖北游泳行业数,通过几天的模索,最终确认通过取湖北旅游相关的百度指数,试着进行分析并得出结论。

可找到百度指数首页index.baidu.com, 发现PC指数从2006年开始,刚好有十年的数据。我想把数据导出来然后通过Matlab等数据分析软件来分析。可遇到如下几个问题 :

(1)取什么样的关键词?

(2)貌似官方的百度指数是图片样式, 没有Excel导出按钮,若手工去做,这工程师浩大啊。(以10个关键词为例,要手工操作:10 * 365 * 10 = 36500次啊。这得几天几夜不睡觉,还容易出来。

通过搜索,找到一个百度提数采集工具。

 

由于工具包太大,这里不下载工具包。需要的朋友可自行下载:www.vdocbook.com/        QQ: 494856288

分析:

(1)设置关键词:湖北旅游,湖北旅游攻略,湖北旅游景点,湖北旅游景点大全

 

观察百度上的指数曲线:

采集结果:

 

通过搜索,找到一个百度提数采集工具。

 

由于工具包太大,这里不下载工具包。需要的朋友可自行下载:www.vdocbook.com/        QQ: 494856288

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章