Python 學習歷程-爬蟲篇: 概述

我從兩年前開始接觸Python, 期間用Python做過各種有趣的事情, 比如用django搭建網站, 用python識別圖片驗證碼, 和本篇中要講到的爬蟲.

爬蟲篇主要記述了我從零開始的爬蟲學習之路, 這是第一次寫這種博客, 由於本人學歷尚淺, 文章中有任何不足和錯誤希望讀者可以指出, 謝謝.

談到爬蟲,初次接觸可能會被這名字嚇住, 說實話, 我最初學編程時候一聽說爬蟲, 就在想 爬蟲是什麼, 聽起來很牛逼的樣子. 

爬蟲簡單的說就是一個①下載, ②篩選內容, ③加以保存的程序.(這裏不夠專業,請看到的大佬見諒). 爬蟲的第一步就是下載網頁, 最重要的一步是篩選內容, 而保存, 根據不同的情景有不同的要求.

 在接下來的篇章中,我也會按照三個過程分別講述一個爬蟲的產生過程, 在文中所有的程序段都是python編寫的, 這裏假定看到本文的讀者已經安裝了python2.7, 或者python3, 並且學習過python語法基礎, 沒有學習過python的讀者請自行百度搜索相關文章學習.

文章結構:

一、初級篇-三步走:

篇(一)  爬蟲第一步: 利用python 下載網頁

篇(二)  爬蟲第二步: 利用python 篩選需要的內容

篇(三)  爬蟲第三步: 利用python 保存數據

注: 轉載請註明出處

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章