原创 Python打印楊輝三角

list = [] for x in range(1, 10): list.append(x) for x in range(1, 10): for i in range(0, 10 - x): prin

原创 2.2 案例4:爬取網頁圖片並下載到本地

課前說明:本章節請求的 url 部分用 ** 代替 本章節需要掌握的知識點: 1、用 js 代碼模擬下拉動作:     document.documentElement.scrollTop= %d   %d表示下拉的幅度 2、如何使用 r

原创 2.3 案例5:爬取某糗事內容

課前說明:本章節請求的 url 部分用 ** 代替 爬蟲分三個模塊:        1、請求模塊:用於構造請求體,並將請求到的網頁(數據)返回給解析模塊;        2、解析模塊:用於提取數據(本章節用xpath提取網頁中的數據),並

原创 2.1 案例3:爬取某讀書網站

課前說明:本章節請求的 url 部分用 ** 代替 本章節需要掌握的知識點: 1、無界面瀏覽器的使用:     driver = r"/home/**/Downloads/chromedriver"     opt = webdriver

原创 2.0 案例2:爬取房源信息以及分析房價

課前說明:本章節請求的 url 部分用 ** 代替 本章節需要掌握的知識點:         1、如何用 xpath 解析數據;         2、如何用 csv 存儲數據(注:由於字典是無序的,所以寫入csv時,表頭可能跟內容搭配不對

原创 1.9 案例一

課前說明:本章節請求的 url 部分用 ** 代替 本章節需要掌握的知識點: request.urlretrieve()  # urlretrieve函數是用來下載資源的函數,第一個參數是請求的 url,第二個參數是要保存的文件名 爬蟲分

原创 1.7認識網頁解析工具

課前說明:        網頁解析工具有很多種,例如:re、xpath、jsonpath、bs4等等,本章節簡單介紹一下re和xpath的用法,其它解析工具自行學習O(∩_∩)O哈!  本章節需要掌握的知識點: re正則的使用 xpath

原创 1.8 selenium工具

課前說明:本章節請求的 url 部分用 ** 代替 本章節需要掌握的知識點: selenium工具是使用。 介紹:        selenium是一種用於web程序測試的工具,selenium測試的代碼可以直接運行在瀏覽器中,就像真正的

原创 1.6IP代理請求

課前說明:本章節請求的 url 部分用 ** 代替  本章節需要掌握的知識點: request.ProxyHandler()   # 構建代理服務器對象   參數爲一個字典 from urllib import request ur

原创 1.4url帶中文的請求

本章節需要掌握的知識點: urllib中的parse parse.quote()    # 對帶中文的參數進行編碼 parse.unquote()   # 解碼 from urllib import request, parse #

原创 1.5會話處理

課前說明:本章節請求的 url 部分用 ** 代替  本章節需要掌握的知識點: cookiejar     # 處理cookie的時候,需要把cookie信息存入一個對象,這個工具就是將cookie進行初始化 request.HTTPCo

原创 1.3簡單的post請求

課前說明:本章節請求的 url 部分用 ** 代替 1、打開網頁 https://fanyi.**.com 2、右擊 -> 檢查 -> 找到network點擊 ->輸入需要翻譯的單詞happy 3、點擊XHR -> 點擊sug文件 4、找

原创 1.1使用urllib發起請求

# 導入urllib from urllib import request # 請求地址url url = 'http://www.baidu.com/' # 構建請求對象 response = request.Request(ur

原创 1.2我的第一個反爬

反爬:【用戶代理】web開發中,同一個url可以對應若干個不同的頁面,後臺可以根據前端發起的請求頭中的用戶代理的不用,決定響應給前端什麼樣的數據。如果用戶代理在判斷的時候檢測到不是我們制定的那幾個用戶代理,就可以拒絕客戶的訪問從而達到反爬

原创 百度學習記錄

python迭代器和生成器 https://www.cnblogs.com/deeper/p/7565571.html python類方法、靜態方法、類方法的區別 https://www.cnblogs.com/wcwnina/p/86