原创 安卓逆向||Google Protobuf 序列化請求逆向

谷歌序列化語法文檔 https://colobu.com/2017/03/16/Protobuf3-language-guide/ 現在某些app數據加密不僅僅使用常規的加密算法,還會使用一些協議對數據序列化後進行傳輸,最近就遇到一個採用

原创 逆向某網站瑞數加密的FSSBBIl1Ugz

某些網站的js現在越來越難搞了,比如高度混淆和動態加載的瑞數,今天講下我研究瑞數的一種生成FSSBBIl1UgzbN7N83T這種cookie的思路。 研究瑞數的都瞭解,瀏覽器會分兩次請求才能拿到數據,第一次是動態加載和混淆的html,內

原创 今日頭條最新signature

最新今日頭條sign加密更新了,抽時間看了看,比上次的加密難度增加了許多。接下來講下加密流程。 今日頭條獲取下一頁面的數據時斷點位置 我們只需要找到window.byted_acrawler的生成就可以了。用fiddler攔擊服務器返回

原创 逆向某網站js加密的FSSBBIl1Ugz

某些網站的js現在越來越難搞了,比如高度混淆和動態加載的瑞數,今天講下我研究瑞數的一種生成FSSBBIl1UgzbN7N83T這種cookie的思路。 研究瑞數的都瞭解,瀏覽器會分兩次請求才能拿到數據,第一次是動態加載和混淆的html,內

原创 Java服務器端結構

數據庫連接池: 應用程序想要訪問數據庫中的數據,需要和數據庫建立連接。而數據庫連接池就是用來 負責分配、管理和釋放數據庫連接,你可以把數據庫連接池理解爲一把鑰匙,而數據庫就是鎖。沒有數據庫連接池 ,應用程序就不方便訪問數據庫。 1)數據庫

原创 今日頭條熱點新聞-獲取_signature

一、簡單說明      熱點新聞等資訊信息繞不過今日頭條,今天講解下如何通過拿到_signature參數來獲取頭條新聞。 二、發現問題      今日頭條的熱點數據是ajax動態刷新得到的,通過篩選測試有數據的url爲https://w

原创 Linux使用命令行進行服務器文件傳輸與登錄

在工作中將完成的項目打包上傳到遠程服務器很普遍,當然對於windows而言文件傳輸可以使用可視化工具xshell,但是開發環境 是linux登錄遠程服務器上傳下載文件要用到ssh以及scp命令了。 1:查看正在使用的ssh版本號 s

原创 Ubuntu中創建虛擬環境

查看系統是否安裝了virtualenv virtualenv --version 安裝同一個包的不同版本,後安裝的包會把原來安裝的包覆蓋掉。這樣,如同一臺機器上兩個項目依賴於相同包的不同版本,則會導致一些項目運行失敗。 sudo pip

原创 百度企業信用js加密研究

一、簡單說明       企業相關信息對於預測企業發展狀況十分重要。基於公司業務,最近分析企業信息查詢網站,瞭解了很多相關的網站,有全國企業信用信息公示, 天眼查,企查查,啓信寶,水滴信用,百度企業信用,阿土伯等企業查詢網站。今天以百度企

原创 驗證碼破解-最新滑動驗證碼

一、簡單說明      驗證碼中極驗驗證碼是做的非常好的一種驗證方式,在第三代點選漢字未出現之前,滑動驗證碼很是流行。現在依然有很多網站在使用。不知什麼時候極驗似乎對滑動驗證碼做了小小的改進。之前需要驗證時會先出現這種不帶滑塊和陰影的驗證

原创 Python爬蟲-JS破解openlaw加密cookie

簡單介紹:     最近做研究js混淆加密,以openlaw作爲網站進行學習研究。openlaw主頁裁判文書欄中有大量案件信息,同時能夠爲客戶提供標準的法律專業知識以及智慧和經驗成果。過程中遇到一些反爬措施,記錄下來。需要抓取的頁面如下:

原创 supervisor進程管理簡單使用

    好久沒寫博客了,本人喜歡私下研究和總結技術,但是並不太喜歡發表供給其他人,使用進程管理部署celery分佈式爬蟲項目已經使用了很久了,今天記錄下使用過的技術。希望以後能常寫博客。 簡單介紹:     supervisor是一個進程

原创 驗證碼破解一

簡介 爬蟲在抓網站數據時,不可避免要和驗證碼做長久鬥爭。當然能繞過最好,但是總有繞不過的驗證碼,此時,對於簡單的可以嘗試破解,有難度的對接打碼平臺。現在驗證碼多種多樣,點選,滑動,英文字母組合等,接下來簡單的聊一聊英文字母組合中的這兩種驗

原创 Python中datetime時間戳精確到單位的用法

對於爬蟲爬取到的文章存儲到數據庫時,有時需要到文檔發佈的時間進行處理。此時要用到datetime將時間精確到某一個單位。 # conding=utf8 from datetime import datetime, timedelta im