台部落YiHong

list = [] for x in range(1, 10): list.append(x) for x in range(1, 10): for i in range(0, 10 - x): prin

2020-02-23 12:55:06

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： 1、用 js 代碼模擬下拉動作： document.documentElement.scrollTop= %d %d表示下拉的幅度 2、如何使用 r

2019-01-16 18:54:53

課前說明：本章節請求的 url 部分用 ** 代替爬蟲分三個模塊： 1、請求模塊：用於構造請求體，並將請求到的網頁（數據）返回給解析模塊； 2、解析模塊：用於提取數據（本章節用xpath提取網頁中的數據），並

2019-01-16 18:54:10

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： 1、無界面瀏覽器的使用： driver = r"/home/**/Downloads/chromedriver" opt = webdriver

2019-01-13 19:07:05

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： 1、如何用 xpath 解析數據； 2、如何用 csv 存儲數據（注：由於字典是無序的，所以寫入csv時，表頭可能跟內容搭配不對

2019-01-12 14:04:32

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： request.urlretrieve() # urlretrieve函數是用來下載資源的函數，第一個參數是請求的 url，第二個參數是要保存的文件名爬蟲分

2019-01-10 14:03:19

課前說明：網頁解析工具有很多種，例如：re、xpath、jsonpath、bs4等等，本章節簡單介紹一下re和xpath的用法，其它解析工具自行學習O(∩_∩)O哈！本章節需要掌握的知識點： re正則的使用 xpath

2019-01-09 19:03:25

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： selenium工具是使用。介紹： selenium是一種用於web程序測試的工具，selenium測試的代碼可以直接運行在瀏覽器中，就像真正的

2019-01-09 19:03:25

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： request.ProxyHandler() # 構建代理服務器對象參數爲一個字典 from urllib import request ur

2019-01-07 19:39:40

本章節需要掌握的知識點： urllib中的parse parse.quote() # 對帶中文的參數進行編碼 parse.unquote() # 解碼 from urllib import request, parse #

2019-01-06 19:34:10

課前說明：本章節請求的 url 部分用 ** 代替本章節需要掌握的知識點： cookiejar # 處理cookie的時候，需要把cookie信息存入一個對象，這個工具就是將cookie進行初始化 request.HTTPCo

2019-01-06 19:34:10

課前說明：本章節請求的 url 部分用 ** 代替 1、打開網頁 https://fanyi.**.com 2、右擊 -> 檢查 -> 找到network點擊 ->輸入需要翻譯的單詞happy 3、點擊XHR -> 點擊sug文件 4、找

2019-01-05 19:37:27

# 導入urllib from urllib import request # 請求地址url url = 'http://www.baidu.com/' # 構建請求對象 response = request.Request(ur

2019-01-03 19:43:28

反爬：【用戶代理】web開發中，同一個url可以對應若干個不同的頁面，後臺可以根據前端發起的請求頭中的用戶代理的不用，決定響應給前端什麼樣的數據。如果用戶代理在判斷的時候檢測到不是我們制定的那幾個用戶代理，就可以拒絕客戶的訪問從而達到反爬

2019-01-03 19:43:28

python迭代器和生成器 https://www.cnblogs.com/deeper/p/7565571.html python類方法、靜態方法、類方法的區別 https://www.cnblogs.com/wcwnina/p/86

2018-12-28 20:34:43