原创 爬蟲試手——百度貼吧爬蟲

自學python有一段時間了,做過的東西還不多,最近開始研究爬蟲,想自己寫一個爬百度貼吧的帖子內容,然後對帖子做分詞和詞頻統計,看看這個吧熱議的關鍵詞都有哪些。百度了好多資料和視頻,學到了不少東西,但也生出了一些問題:1、http請求用py

原创 模擬web請求——簡單的小程序提高工作效率

研究了一段時間爬蟲,瞭解到了用代碼發起http請求的方法,想練練手。突然想起工作上遇到的一個難題,感覺非常適合。問題是這樣的:工作上維護的一個系統,有時候代碼腳本有變更,需要通過一個前臺頁面進行刷新。但是因爲服務器高可用的要求,總共部署了2

原创 用selenium實現百度貼吧自動發帖

寫完前面兩篇以後,就打算寫個百度貼吧自動發帖程序,結果研究了好久,發現比預想的難太多了。。。一開始打算用requests模擬登陸,用F12抓了包,看post請求參數:參數也特麼太多了,簡直喪心病狂,變化參數有token、tt、gid、rsa