Python網絡數據採集

在這裏插入圖片描述

本書特色

本書適合熟悉Python的程序員、安全專業人士、網絡管理員閱讀。書中不僅介紹了網絡數據採集的基本原理,還深入探討了更高級的主題,比如分析原始數據、用網絡爬蟲測試網站等。此外,書中還提供了詳細的代碼示例,以幫助你更好地理解書中的內容。

通過閱讀本書,你將能夠:

解析複雜的HTML頁面
遍歷多個網頁和網站
瞭解API的基本概念和工作原理
學習存儲數據的方法
下載、讀取並抽取網絡文檔中的數據
使用工具和方法清洗格式異常的數據
讀取並處理自然語言
越過表單和登錄窗口採集數據
學習採集JavaScript的方法
學習圖像處理和文字識別方法

“這本書中的工具和示例幫我輕鬆地將一些重複性工作自動化了,我可以將省下來的時間用於解決更有意思的問題。這是一本實用手冊,非常適合用來解決實際工作中的問題。”——Eric VanWyk,美國歐林工程學院電子計算機工程師

目錄

版權聲明
O'Reilly Media, Inc. 介紹
譯者序
第一部分 創建爬蟲
第 1 章 初見網絡爬蟲
第 2 章 複雜 HTML 解析
第 3 章 開始採集
第 4 章 使用 API
第 5 章 存儲數據
第 6 章 讀取文檔
第二部分 高級數據採集
第 7 章 數據清洗
第 8 章 自然語言處理
第 9 章 穿越網頁表單與登錄窗口進行採集
第 10 章 採集 JavaScript
第 11 章 圖像識別與文字處理
第 12 章 避開採集陷阱
第 13 章 用爬蟲測試網站
第 14 章 遠程採集
附錄 A Python 簡介
附錄 B 互聯網簡介
附錄 C 網絡數據採集的法律與道德約束
作者簡介
封面介紹

下載

https://pan.baidu.com/s/1vyvX0ziwFp4fZLNt65b9vw

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章