面試被問高併發流量控制,我臉都綠了...

雲棲號資訊:【點擊查看更多行業資訊
在這裏您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

前言

在實際項目中,曾經遭遇過線上5W+QPS的峯值,也在壓測狀態下經歷過10W+QPS的大流量請求,本篇博客的話題主要就是自己對高併發流量控制的一點思考。

應對大流量的一些思路

首先,我們來說一下什麼是大流量?

大流量,我們很可能會冒出:TPS(每秒事務量),QPS(每秒請求量),1W+,5W+,10W+,100W+...。其實並沒有一個絕對的數字,如果這個量造成了系統的壓力,影響了系統的性能,那麼這個量就可以稱之爲大流量了。

其次,應對大流量的一些常見手段是什麼?

緩存:說白了,就是讓數據儘早進入緩存,離程序近一點,不要大量頻繁的訪問DB。
降級:如果不是核心鏈路,那麼就把這個服務降級掉。打個比喻,現在的APP都講究千人千面,拿到數據後,做個性化排序展示,如果在大流量下,這個排序就可以降級掉!關注公衆號互聯網架構師,回覆關鍵字2T,獲取最新架構視頻
限流:大家都知道,北京地鐵早高峯,地鐵站都會做一件事情,就是限流了!想法很直接,就是想在一定時間內把請求限制在一定範圍內,保證系統不被沖垮,同時儘可能提升系統的吞吐量。

注意到,有些時候,緩存和降級是解決不了問題的,比如,電商的雙十一,用戶的購買,下單等行爲,是涉及到大量寫操作,而且是核心鏈路,無法降級的,這個時候,限流就比較重要了。

那麼接下來,我們重點說一下,限流。

限流的常用方式

限流的常用處理手段有:計數器、滑動窗口、漏桶、令牌。

計數器

計數器是一種比較簡單的限流算法,用途比較廣泛,在接口層面,很多地方使用這種方式限流。在一段時間內,進行計數,與閥值進行比較,到了時間臨界點,將計數器清0。

066B329C_9D28_4fb2_81FC_D0868A16D4DA

90F3BB7F_C8DB_4aac_9150_5F7C3E32253A

這裏需要注意的是,存在一個時間臨界點的問題。舉個栗子,在12:01:00到12:01:58這段時間內沒有用戶請求,然後在12:01:59這一瞬時發出100個請求,OK,然後在12:02:00這一瞬時又發出了100個請求。這裏你應該能感受到,在這個臨界點可能會承受惡意用戶的大量請求,甚至超出系統預期的承受。

滑動窗口

由於計數器存在臨界點缺陷,後來出現了滑動窗口算法來解決。

054727C2_8933_4f8d_ADAD_9220F944D4F3

滑動窗口原理圖
滑動窗口的意思是說把固定時間片,進行劃分,並且隨着時間的流逝,進行移動,這樣就巧妙的避開了計數器的臨界點問題。也就是說這些固定數量的可以移動的格子,將會進行計數判斷閥值,因此格子的數量影響着滑動窗口算法的精度。

漏桶

雖然滑動窗口有效避免了時間臨界點的問題,但是依然有時間片的概念,而漏桶算法在這方面比滑動窗口而言,更加先進。
有一個固定的桶,進水的速率是不確定的,但是出水的速率是恆定的,當水滿的時候是會溢出的。

DFFDE080_7E69_4b26_AA11_AE90652F0DC0

6B8CB423_B83A_4388_ACE7_7303B43F2255

令牌桶

注意到,漏桶的出水速度是恆定的,那麼意味着如果瞬時大流量的話,將有大部分請求被丟棄掉(也就是所謂的溢出)。爲了解決這個問題,令牌桶進行了算法改進。

416418C0_5BE9_48c8_8FE9_B97128CFAB0A

生成令牌的速度是恆定的,而請求去拿令牌是沒有速度限制的。這意味,面對瞬時大流量,該算法可以在短時間內請求拿到大量令牌,而且拿令牌的過程並不是消耗很大的事情。(有一點生產令牌,消費令牌的意味)

不論是對於令牌桶拿不到令牌被拒絕,還是漏桶的水滿了溢出,都是爲了保證大部分流量的正常使用,而犧牲掉了少部分流量,這是合理的,如果因爲極少部分流量需要保證的話,那麼就可能導致系統達到極限而掛掉,得不償失。

0C381D09_EA9B_4cd4_9C8F_83F4F8678B4C

限流神器:Guava RateLimiter

Guava不僅僅在集合、緩存、異步回調等方面功能強大,而且還給我們封裝好了限流的API!

Guava RateLimiter基於令牌桶算法,我們只需要告訴RateLimiter系統限制的QPS是多少,那麼RateLimiter將以這個速度往桶裏面放入令牌,然後請求的時候,通過tryAcquire()方法向RateLimiter獲取許可(令牌)。

673F76E4_8DB9_40d0_95C2_16AFC4A7FDBD

分佈式場景下的限流

上面所說的限流的一些方式,都是針對單機而言的,其實大部分的場景,單機的限流已經足夠了。分佈式下限流的手段常常需要多種技術相結合,比如Nginx+Lua,Redis+Lua等去做。本文主要討論的是單機的限流,這裏就不在詳細介紹分佈式場景下的限流了。

一句話,讓系統的流量,先到隊列中排隊、限流,不要讓流量直接打到系統上。

【雲棲號在線課堂】每天都有產品技術專家分享!
課程地址:https://yqh.aliyun.com/zhibo

立即加入社羣,與專家面對面,及時瞭解課程最新動態!
【雲棲號在線課堂 社羣】https://c.tb.cn/F3.Z8gvnK

原文發佈時間:2020-07-17
本文作者:張豐哲
本文來自:“互聯網架構師”,瞭解相關信息可以關注“互聯網架構師

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章