本人讀旅遊專業碩士,2016年畢業。本人喜歡游泳也需喜歡自己的專業,因此畢業論文課題是《湖北省近十年旅遊業發展分析》。
按照度孃的官方介紹,百度指數是以百度網頁搜索和百度新聞搜索爲基礎的免費海量數據分析服務,能反映關鍵詞在過去一段時間內的網絡曝光率及用戶關注度!
百度採集工具: 靈動百度數據採集。
百度指數採集工具:
https://item.taobao.com/item.htm?id=545046986518
通過各種渠道瞭解湖北游泳行業數,通過幾天的模索,最終確認通過取湖北旅遊相關的百度指數,試着進行分析並得出結論。
可找到百度指數首頁index.baidu.com, 發現PC指數從2006年開始,剛好有十年的數據。我想把數據導出來然後通過Matlab等數據分析軟件來分析。可遇到如下幾個問題 :
(1)取什麼樣的關鍵詞?
(2)貌似官方的百度指數是圖片樣式, 沒有Excel導出按鈕,若手工去做,這工程師浩大啊。(以10個關鍵詞爲例,要手工操作:10 * 365 * 10 = 36500次啊。這得幾天幾夜不睡覺,還容易出來。
通過搜索,找到一個百度提數採集工具。
由於工具包太大,這裏不下載工具包。需要的朋友可自行下載:www.vdocbook.com/ QQ: 494856288
分析:
(1)設置關鍵詞:湖北旅遊,湖北旅遊攻略,湖北旅遊景點,湖北旅遊景點大全
觀察百度上的指數曲線:
採集結果:
通過搜索,找到一個百度提數採集工具。