基於SpringCloud開發的分佈式系統,遇到爬蟲、接口盜刷怎麼辦?

點擊上方“碼農突圍”,馬上關注

這裏是碼農充電第一站,回覆“666”,獲取一份專屬大禮包

真愛,請設置“星標”或點個“在看”

來源:https://www.oschina.net/p/kk-anti-reptile

kk-anti-reptile是,適用於基於spring-boot開發的分佈式系統的反爬蟲組件。


# 系統要求

  • 基於spring-boot開發(spring-boot1.x, spring-boot2.x均可)

  • 需要使用redis


# 工作流程

kk-anti-reptile使用基於Servlet規範的的Filter對請求進行過濾,在其內部通過spring-boot的擴展點機制,實例化一個Filter,並注入到Spring容器FilterRegistrationBean中,通過Spring注入到Servlet容器中,從而實現對請求的過濾

在kk-anti-reptile的過濾Filter內部,又通過責任鏈模式,將各種不同的過濾規則織入,並提供抽象接口,可由調用方進行規則擴展

Filter調用則鏈進行請求過濾,如過濾不通過,則攔截請求,返回狀態碼509,並輸出驗證碼輸入頁面,輸出驗證碼正確後,調用過濾規則鏈對規則進行重置

目前規則鏈中有如下兩個規則

ip-rule

ip-rule通過時間窗口統計當前時間窗口內請求數,小於規定的最大請求數則可通過,否則不通過。時間窗口、最大請求數、ip白名單等均可配置


ua-rule

ua-rule通過判斷請求攜帶的User-Agent,得到操作系統、設備信息、瀏覽器信息等,可配置各種維度對請求進行過濾


命中規則後

命中爬蟲和防盜刷規則後,會阻斷請求,並生成接除阻斷的驗證碼,驗證碼有多種組合方式,如果客戶端可以正確輸入驗證碼,則可以繼續訪問

驗證碼有中文、英文字母+數字、簡單算術三種形式,每種形式又有靜態圖片和GIF動圖兩種圖片格式,即目前共有如下六種,所有類型的驗證碼會隨機出現,目前技術手段識別難度極高,可有效阻止防止爬蟲大規模爬取數據


接入使用

後端接入非常簡單,只需要引用kk-anti-reptile的maven依賴,並配置啓用kk-anti-reptile即可


加入maven依賴

<dependency>    <groupId>cn.keking.project</groupId>    <artifactId>kk-anti-reptile</artifactId>    <version>1.0.0-SNAPSHOT</version></dependency>

配置啓用 kk-anti-reptile

anti.reptile.manager.enabled=true

前端需要在統一發送請求的ajax處加入攔截,攔截到請求返回狀態碼509後彈出一個新頁面,並把響應內容轉出到頁面中,然後向頁面中傳入後端接口baseUrl參數即可,以使用axios請求爲例:

import axios from 'axios';import {baseUrl} from './config';
axios.interceptors.response.use(  data => {    return data;  },  error => {    if (error.response.status === 509) {      let html = error.response.data;      let verifyWindow = window.open("","_blank","height=400,width=560");      verifyWindow.document.write(html);      verifyWindow.document.getElementById("baseUrl").value = baseUrl;    }  });
export default axios;

# 注意

1.apollo-client需啓用bootstrap

使用apollo配置中心的用戶,由於組件內部用到@ConditionalOnProperty,要在application.properties/bootstrap.properties中加入如下樣例配置,(apollo-client需要0.10.0及以上版本)

apollo.bootstrap.enabled = true

2.需要有Redisson連接

如果項目中有用到Redisson,kk-anti-reptile會自動獲取RedissonClient實例對象; 如果沒用到,需要在配置文件加入如下Redisson連接相關配置

spring.redisson.address=redis://192.168.1.204:6379spring.redisson.password=xxx

# 配置一覽表

在spring-boot中,所有配置在配置文件都會有自動提示和說明,如下圖




所有配置都以anti.reptile.manager爲前綴,如下爲所有配置項及說明

---END---

重磅!魚哥微信好友坑位限時開放啦!

掃碼直接加魚哥微信號,不僅可以圍觀魚哥平時所思和覆盤的內容。還可以幫你免費內推大廠,技術交流,一起探索職場突圍,收入突圍,技術突圍。一定要備註:開發方向+地點+學校/公司+暱稱(如Java開發+上海+拼夕夕+猴子)

▲長按加魚哥微信,趕緊上車

推薦閱讀

•   再見,“阿里三代掌門人”蔣凡!

•   實錘了!Chrome存在嚴重漏洞!

•   你這代碼寫得真醜,滿屏的try-catch,全局異常處理不會嗎?

•   GitHub上最勵志的計算機自學教程:8個月,從中年Web前端到亞馬遜百萬年薪軟件工程師 | 中文版

•   面試官問我:一個 TCP 連接可以發多少個 HTTP 請求?我竟然回答不上來...

•   爲什麼都建議程序員不要做“外包”?看完這些經歷,很辛酸

歡迎關注我的公衆號“碼農突圍”,如果喜歡,麻煩點一下“在看”~

如有收穫,點個在看,誠摯感謝

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章