python 實現華安信達論壇自動登錄

原創

2020-07-05 21:17

近期需要從論壇採集一些數據，就使用爬蟲專屬語言python寫了一個小爬蟲，實現自動登錄，併到指定的板塊採集帖子標題、作者等信息。

實現自動登錄的關鍵在於模擬瀏覽器向服務器發送數據包，用Fiddler抓包看一下，過程非常清晰：

1. 論壇的登錄頁面鏈接 http://bbs.cisps.org/ucp.php?mode=login

2. 研究Fiddler捕捉到的數據包，可以看到瀏覽器以Post方法向服務器發送了包含用戶名和口令等字段，如圖1所示，

圖1

除username和password之外，還有一項sid，經過多次抓包分析，sid字段的值是cookie中的一項，如圖2所示，

圖2

cookie中phpbb2mysql的值與之前我們分析的sid值一致，到此，我們就能夠完整構造數據包模擬瀏覽器登錄

3. 完整代碼：

		username = 'xxxxxxxx'		# 用戶名
		password = xxxxxxxx		# 口令
		url_0 = 'http://bbs.cisps.org/'		# 首先請求主頁
		req_0 = urllib2.Request(url_0 ,headers = self.headers)
		self.opener.open(req_0).read()
		phpbb2mysql_sid = ''				
		for cookie in self.cookieHandler:
			if cookie.name=="phpbb2mysql_sid":
				phpbb2mysql_sid = cookie.value		#　關鍵：將Cookie中的phpbb2mysql_sid值賦給變量
		postdata = {
					'username':	 username,
					'password':	 password,
					'autologin': 'on',
					'sid':       phpbb2mysql_sid,
					'redirect':	 'index.php',
					'login':	 '登錄',
					'redirect':	 './ucp.php?mode=login'}		
		postencodedata = urllib.urlencode(postdata)		# 數據包編碼
		url_1 = 'http://bbs.cisps.org/ucp.php?mode=login'
		req_1 = urllib2.Request(url_1,postencodedata,headers=self.headers)		# 請求
		data_1  = self.opener.open(req_1).read()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

多語言實現電子郵件發送功能

C #include <curl/curl.h> #include <string.h> #include <stdio.h> #define from "<[email protected]>" #define to

2020-06-19 00:56:37

【DDS】基於OpenDDS的DDS-RPC實現

基於OpenDDS的DDS-RPC實現關於DDS-RPC的概念原理參考下文： DDS-RPC通信機制代碼實現 OpenDDS沒有實現RPC，但根據RPC over DDS給出的規範。可以利用OpenDDS實現 DDS-RP

2020-07-06 02:37:46

JavaScript實現驗證功能

用JavaScript實現網頁用戶名，密碼，郵箱，手機號等驗證功能 1.用戶名必須填寫 2.密碼長度8-16之間 3.郵箱地址，手機號必須符合正確格式 4.必須同意（勾選複選框）才能提交 5.當鼠標離開輸入框點擊後就會出現提示 <

weixin_44125722

2020-07-05 02:18:04

Flink的Source端和Sink端大全

Flink和各種組件enviromentSourceflink + kafka (flink 消費 kafka 中的數據)TransformTransformation 的介紹複雜的方法SinkKafka SinkRedis Si

youAreRidiculous

2020-07-04 08:27:55

Flink的使用

Flink APIFlink 的核心概念Flink 的編程步驟延遲執行（懶加載）指定 key指定轉換函數（Transformation）Flink API 編程支持的數據源 DataSetsink 的目的地（代碼演示）計數器分佈式

youAreRidiculous

2020-07-04 08:27:45

java《學生成績管理系統》功能介紹以及代碼實現

學生成績管理系統一、程序結構二、各模塊的功能及程序說明。關於我的任務部分：定義菜單函數，先打印菜單，再用switch語句給用戶選擇，應用實例化輸入流對象，調用函數完成菜單頁面的打印和選擇；寫一個判斷是否錄入數據的類，通過i

哈夫曼的树丶

2020-07-02 07:07:01

33、字符匹配算法

33、實現一個挺高級的字符匹配算法：給一串很長字符串，要求找到符合要求的字符串，例如目的串：123 1******3***2 ,12*****3

2020-06-23 17:26:11

n支隊伍比賽

n支隊伍比賽，分別編號爲0，1，2。。。。n-1，已知它們之間的實力對比關係，存儲在一個二維數組w[n][n]中，w[i][j] 的值代表編號爲i，j的隊伍中更強的一支。所以w[i][j]=i 或者j，現在給出它們的出場順序，並存儲在

2020-06-23 17:26:05

Unity實現鼠標滑動控制物體移動

一、思路：在3D場景中，通過鼠標點擊“地面”獲取位置信息來使玩家進行橫向相對運動。 1、在場景中創建一個Plane作爲地面。 2、使用射線檢測分別記錄第一次鼠標點擊（Input.GetMouseButtonDown(0)）時的位

惠新西街小豪

2020-06-22 23:05:55

CRFasRNN 代碼實現 keras/Tensorflow 跑demo

keras version：https://github.com/sadeepj/crfasrnn_keras live demo：http://crfasrnn.torr.vision caffe version: http:/

2020-06-21 07:16:30

語法分析器（syntax analyzer）【C實現】

查看正文內容 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <stdarg.h> #include <stdbool.h> #include

2020-06-19 08:26:07

詞法分析器（Lexical Analyzer）【C實現】

查看正文內容 #include <stdlib.h> #include <stdio.h> #include <stdarg.h> #include <ctype.h> #include <string.h> #include <

2020-06-19 02:25:50

golang實現記錄集轉化爲樹狀json結構實現echarts sunburst 旭日圖

數據庫中的數據記錄 type Node struct { Name string `json:"name"` Value int `json:"value"` } type Subtree struct { Na

2020-06-19 02:18:19

哲學家用餐問題（Dining philosophers）【代碼實現】

C #include <pthread.h> #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <stdarg.h> #define N 5

2020-06-19 00:56:39

CRC-32【代碼實現】

C #include <inttypes.h> #include <stdio.h> #include <string.h> uint32_t rc_crc32(uint32_t crc, const char *buf, s

2020-06-19 00:56:36

24小時熱門文章

HTTP URL 詳解

最新文章

最新評論文章