Python系列爬蟲之簡單分析Chrome瀏覽器瀏覽記錄

image.png

前言

利用Python簡單分析一下Chrome瀏覽器的網頁瀏覽記錄,我們一起愉快的學習吧。

開發工具

Python版本:3.6.4
相關模塊:

pyecharts模塊;

wordcloud模塊;

以及一些Python自帶的模塊。

**DB.Browser版本:**3.11.0

環境搭建

關於python:

安裝Python並添加到環境變量,pip安裝需要的相關模塊即可。

關於DB.Browser:

下載地址:

https://github.com/sqlitebrowser/sqlitebrowser/releases

建議下載免安裝版本的(相關文件中也提供了免安裝版本)。

原理簡介

Chrome瀏覽器的網頁瀏覽歷史記錄一般保存在:

C:\Users<USERNAME>\AppData\Local\Google\Chrome\UserData\Default\history

利用DB.Browser打開它,發現與歷史瀏覽記錄相關的表有urlsvisits

圖片

打開觀察一下表的結構:

圖片

圖片

瞭解了表的結構之後,我們就可以愉快地寫代碼提取歷史瀏覽記錄了:

圖片

將獲取到的數據進行簡單的可視化,結果如下:

圖片

圖片

看完篇文章喜歡的朋友點個贊支持一下,關注我每天分享Python數據爬蟲案例,下篇文章分享是Python監控比特幣價格走勢

All done~完整源代碼詳見個人簡介或者私信獲取相關文件。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章