架構必經之路2 - 熔斷機制

架構之旅1 - 扣減庫存

架構之旅2 - 熔斷機制

項目中要做一個熔斷機制,預防對第三方的接口調用壓力太大。下面我介紹下項目中用到的熔斷機制。

一、熔斷機制  

1.熔斷檢測機制

(1)請求call到backend後,首先判斷熔斷開關是否打開

(2)如果熔斷開關已打開,則表明當前請求不能被處理

(3)如果熔斷開關未打開,則判斷時間窗口(判斷統計錯誤率)是否已滿

(4)如果時間窗口(判斷統計錯誤率)未滿,則請求桶(redis) 中的請求數加1

(5)如果返回的response 有異常,則失敗桶(redis) 的失敗數加1,如果返回的response沒有異常,則成功桶(redis) 的成功數加1

(6)如果時間窗口(判斷統計錯誤率)已滿,則開始判斷是否需要熔斷

 2.熔斷算法

充要條件:

(1)請求總數 > 設定值X

(2)失敗率 > 設定值Y

請求總數可以從請求桶redis 中獲取到

失敗率 = 失敗數 ÷ 請求數 × 100%

當請求總數大於一定值,且失敗率大於一定值時,則表示請求失敗數太多了,需要熔斷API請求

3.統計失敗率的時間窗口

 (1)每次請求,都會判斷時間窗口是否已滿(如5分鐘),如果時間窗口已滿,則重新開始計時,且清理請求數/成功數/失敗數

 (2)第一次開始的起始時間默認爲當前時間。

4.熔斷持續時間

(1)如果出現問題,可以將所有請求鏈路熔斷掉,熔斷恢復時間可以假定爲1分鐘,可以根據不同的環境進行調整

(2)熔斷恢復時間沒有根據環境來進行動態調整,比如網絡差的時候,持續了很長時間網絡都很差,這個時候,可以動態遞增熔斷時間

5.手動熔斷

因爲熔斷是通過統計單位時間內的失敗率來判斷是否需要熔斷的,而有時候我們需要快速切斷請求鏈路,比如充值請求量太大的時候,導致很多訂單都被退款,這個時候我們可以先熔斷獲取套餐接口,這樣用戶就拿不到套餐,就不能充值了。

6.總熔斷檢測開關

有時候我們不需要熔斷檢測,這個時候我們就需要一個總開關,打開總開關,則進行熔斷檢測,關閉總開關,則不進行熔斷檢測。

7.查看當前熔斷的狀態

我們做了熔斷檢測,但是需要check下是否work了,可以check下以下參數

8.還有哪些可以優化的?有哪些不足?以及您是否遇到熔斷的坑?

歡迎留言一起探討熔斷機制~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章