Python系列爬蟲之簡單分析Chrome瀏覽器瀏覽記錄

原創

2021-04-21 21:23

前言

利用Python簡單分析一下Chrome瀏覽器的網頁瀏覽記錄，我們一起愉快的學習吧。

開發工具

Python版本：3.6.4

相關模塊：

pyecharts模塊；

wordcloud模塊；

以及一些Python自帶的模塊。

**DB.Browser版本：**3.11.0

環境搭建

關於python：

安裝Python並添加到環境變量，pip安裝需要的相關模塊即可。

關於DB.Browser：

下載地址：

https://github.com/sqlitebrowser/sqlitebrowser/releases

建議下載免安裝版本的(相關文件中也提供了免安裝版本)。

原理簡介

Chrome瀏覽器的網頁瀏覽歷史記錄一般保存在：

C:\Users<USERNAME>\AppData\Local\Google\Chrome\UserData\Default\history

利用DB.Browser打開它，發現與歷史瀏覽記錄相關的表有urls和visits：

打開觀察一下表的結構：

瞭解了表的結構之後，我們就可以愉快地寫代碼提取歷史瀏覽記錄了：

將獲取到的數據進行簡單的可視化，結果如下：

看完篇文章喜歡的朋友點個贊支持一下，關注我每天分享Python數據爬蟲案例，下篇文章分享是Python監控比特幣價格走勢

All done~完整源代碼詳見個人簡介或者私信獲取相關文件。。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

安卓動態鏈接庫文件體積優化探索實踐

背景介紹應用安裝包的體積影響着用戶下載量、安裝時長、用戶磁盤佔用量等多個方面，據Google Play統計，應用體積每增加6MB，安裝的轉化率將下降1%。安裝包的體積受諸多方面影響，針對dex、資源文件、so文件都有不同的優化策略，在

2024-02-05 12:42:33

Linux搭建ClickHouse集羣環境

部署規格部署clickhouse需要同一內網的機器三臺，本文將以三臺VM虛擬機172.30.129.171（以下稱爲171）、172.30.129.172（以下稱爲172）、172.30.129.173（以下稱爲173）三臺機器爲示例演示

2023-07-06 23:05:12

Epinio：Kubernetes 的應用程序開發引擎

王海龍，Rancher 中國社區技術經理，Linux Foundation APAC Evangelist，負責 Rancher 中國技術社區的維護和運營。擁有 9 年的雲計算領域經驗，經歷了 OpenStack 到 Kubernete

2023-04-29 11:58:01

python變量2相關知識

一、使用製表符\t和換行符\n來添加空白第二、刪除空白 Strip()去掉前後的空白，下面的方法是對這個方法的延伸拓展 lStrip() 去掉左邊的空白,rstrip()去掉右邊的空白什麼叫做python裏面的方法舉個例子

2022-04-30 09:28:37

OpenCV 中的圖像處理 005_形態變換

本文主要內容來自於 OpenCV-Python 教程的 OpenCV 中的圖像處理部分，這部分的全部主要內容如下：改變色彩空間學習在不同色彩空間之間改變圖像。另外學習跟蹤視頻中的彩色對象。圖像的幾何變換學習對圖像應用不同

2022-04-30 09:19:21

如何忽略正則表達式主題字符串中的空格？ - How to ignore whitespace in a regular expression subject string?

問題： Is there a simple way to ignore the white space in a target string when searching for matches using a regular expr

2021-12-28 09:18:06

終於有人將MySQL的安裝講明白了

前言在日常開發中，存儲數據的最常用的方式便是數據庫了，其中最爲著名的便是MySQL數據庫，因它簡便易於上手而且可擴展性強大，跨平臺使得它廣爲使用，今天我們就來具體聊聊它的安裝。一、安裝過程我們所使用的是MySQL 5.7版本，這個版本

2021-12-27 21:19:50

Android Lollipop, AppCompat ActionBar custom view doesn't take up whole screen width

問題： So, I just updated my codebase to Lollipop, and I'm having issues with the Action Bar. 所以，我剛剛將我的代碼庫更新爲Lollipop，而且我

2021-12-26 21:18:05

Handling backreferences to capturing groups in re.sub replacement pattern

問題： I want to take the string 0.71331, 52.25378 and return 0.71331,52.25378 - ie just look for a digit, a comma, a spac

2021-12-26 09:31:42

Python學習（學習視頻b站小甲魚）

001講 0. Python 是什麼類型的語言？Python是腳本語言以簡單的方式快速完成某些複雜的事情通常是創造腳本語言的重要原則。特性：語法和結構通常比較簡單學習和使用通常比較簡單通常以容易修改程序的“解釋”作爲運行方式，

2021-12-25 21:47:57

es Dynamic mapping的機制和內置analyzers

Dynamic mapping的機制，使得無需手動定義mappings，es會自動根據文檔信息，推算出字段類型，但這也存在不好的地方，無法控制結構。如果將Dynamic設置爲true，mapping會被更新，如果設置爲false，mapp

2021-12-25 21:39:28

python中的hashlib模塊的使用

hashlib模塊 #哈希算法也叫摘要算法,相同的數據始終得到相同的輸出,不同的數據得到不同的輸出。#(1)哈希將不可變的任意長度的數據,變成具有固定長度的唯一值 #(2)字典的鍵值對映射關係是通過哈希計算的,哈希存儲的數據是散列(無序)

2021-12-25 21:39:11

第015講：字符串：格式化 (課後測試題及答案)

0、Python之.format（）方法 format()：格式化輸出，是Python2.6新增的格式化字符串的方法，把傳統的%替換爲{}來實現格式化輸出（%：格式化操作符），相對於老版的%格式方法，有很多的優點。優點： 1.format

2021-12-25 21:30:12

Web探索之旅 | 第三部分第三課：協議

>作者謝恩銘，公衆號「程序員聯盟」（微信號：coderhub）。轉載請註明出處。原文：https://www.jianshu.com/p/a3069dd0a016 >《Web探索之旅》全系列內容簡介前言 TCP 和 UDP

2021-12-25 21:25:53

Web探索之旅 | 第四部分：Web程序員

>作者謝恩銘，公衆號「程序員聯盟」（微信號：coderhub）。轉載請註明出處。原文：https://www.jianshu.com/p/a3d47eebd3b5 >《Web探索之旅》全系列內容簡介前言什麼是 Web 程

2021-12-25 21:25:52

24小時熱門文章

最新文章

最新評論文章