【商城秒殺項目】-- 流量削峯應該怎麼做

如果你看過秒殺系統的流量監控圖的話，你會發現它是一條直線，在秒殺開始那一秒是一條很直很直的線，這是因爲秒殺請求在時間上高度集中於某一特定的時間點。這樣一來，就會導致一個特別高的流量峯值，它對資源的消耗是瞬時的。

但是對秒殺這個場景來說，最終能夠搶到商品的人數是固定的，也就是說100人和10000人發起請求的結果都是一樣的，併發度越高，無效請求也越多。

但是從業務上來說，秒殺活動是希望更多的人來參與的，也就是開始之前希望有更多的人來刷頁面，但是真正開始下單時，秒殺請求並不是越多越好。因此我們可以設計一些規則，讓併發的請求更多地延緩，而且我們甚至可以過濾掉一些無效請求

爲什麼要削峯

通常秒殺系統爲什麼要進行削峯呢？或者說峯值會帶來哪些壞處？

我們知道服務器的處理資源是恆定的，你用或者不用它的處理能力都是一樣的，所以出現峯值的話，很容易導致忙的時候處理不過來，閒的時候卻又沒有什麼要處理。但是由於要保證服務質量，我們很多的處理資源只能按照忙的時候來預估，而這會導致資源的一個浪費。這就好比因爲存在早高峯和晚高峯的問題，所以有了錯峯限行的解決方案。

削峯的存在，一是可以讓服務端處理變得更加平穩，二是可以節省服務器的資源成本。

針對秒殺這一場景，削峯從本質上來說就是更多地延緩用戶請求的發出，以便減少和過濾掉一些無效請求，它遵從“請求數要儘量少”的原則。

本篇博客介紹流量削峯的一些操作思路：排隊、答題、分層過濾，這幾種方式都是無損（即不會損失用戶的發出請求）的實現方案

削峯操作思路一：排隊

要對流量進行削峯，最容易想到的解決方案就是用消息隊列來緩衝瞬時流量，把同步的直接調用轉換成異步的間接推送，中間通過一個隊列在一端承接瞬時的流量洪峯，在另一端平滑地將消息推送出去。在這裏，消息隊列就像“水庫”一樣，攔蓄上游的洪水，削減進入下游河道的洪峯流量，從而達到減免洪水災害的目的。

用消息隊列來緩衝瞬時流量的方案，如下圖所示：

但是，如果流量峯值持續一段時間達到了消息隊列的處理上限，例如本機的消息積壓達到了存儲空間的上限，消息隊列同樣也會被壓垮，這樣雖然保護了下游的系統，但是和直接把請求丟棄也沒多大的區別。就像遇到洪水爆發時，即使是有水庫恐怕也無濟於事

除了消息隊列，類似的排隊方式還有很多，例如：

利用線程池加鎖等待也是一種常用的排隊方式
先進先出、先進後出等常用的內存排隊算法的實現方式
把請求序列化到文件中，然後再順序地讀文件（例如基於MySQL binlog的同步機制）來恢復請求等方式

可以看到，這些方式都有一個共同特徵，就是把“一步的操作”變成“兩步的操作”，其中增加的一步操作用來起到緩衝的作用

削峯操作思路二：答題

增加答題功能的目的主要是爲了增加購買的複雜度，從而達到以下兩個目的：

第一個目的是防止部分買家使用秒殺器在參加秒殺時作弊。2011年秒殺非常火的時候，秒殺器也比較猖獗，因而沒有達到全民參與和營銷的目的，所以系統增加了答題來限制秒殺器；增加答題後，下單的時間基本控制在2s後，秒殺器的下單比例也大大下降，本項目答題頁面如下圖所示：

第二個目的其實就是延緩請求，起到對請求流量進行削峯的作用，從而讓系統能夠更好地支持瞬時的流量高峯。這個重要的功能就是把峯值的下單請求拉長，從以前的1s之內延長到2s~10s。這樣一來，請求峯值就基於時間分片了，這個時間的分片對服務端處理併發非常重要，會大大減輕壓力。而且，由於請求具有先後順序，靠後的請求到來時自然也就沒有庫存了，因此根本到不了最後的下單步驟，所以真正的併發寫就非常有限了。這種設計思路目前用得非常普遍，如當年支付寶的“咻一咻”、微信的“搖一搖”都是類似的方式

秒殺答題的設計思路可參考下圖：

如上圖所示，整個秒殺答題的邏輯主要分爲3部分：

題庫生成模塊，這個部分主要就是生成一個個問題和答案，其實題目和答案本身並不需要很複雜，重要的是能夠防止由機器來算出結果，即防止秒殺器來答題
題庫的推送模塊，用於在秒殺答題前，把題目提前推送給詳情繫統和交易系統。題庫的推送主要是爲了保證每次用戶請求的題目是唯一的，目的也是防止答題作弊
題目的圖片生成模塊，用於把題目生成爲圖片格式，並且在圖片裏增加一些干擾因素。這也同樣是爲防止機器直接來答題，它要求只有人才能理解題目本身的含義。這裏還要注意一點，由於答題時網絡比較擁擠，我們應該把題目的圖片提前推送到CDN上並且要進行預熱，不然的話當用戶真正請求題目時，圖片可能加載比較慢，從而影響答題的體驗

真正答題的邏輯比較簡單，很好理解：當用戶提交的答案和題目對應的答案做比較，如果通過了就繼續進行下一步的下單邏輯，否則就失敗

驗證的邏輯如下圖所示：

注意，這裏面的驗證邏輯，除了驗證問題的答案以外，還包括對用戶本身身份的驗證，例如是否已經登錄、用戶的Cookie是否完整、用戶是否重複頻繁提交等

除了做正確性驗證，我們還可以對提交答案的時間做些限制，例如從開始答題到接受答案要超過1s，因爲小於1s是人爲操作的可能性很小，這樣也能防止機器答題的情況

削峯操作思路三：分層過濾

前面介紹的排隊和答題要麼是少發請求，要麼對發出來的請求進行緩衝，而針對秒殺場景還有一種方法，就是對請求進行分層過濾，從而過濾掉一些無效的請求。分層過濾其實就是採用“漏斗”式設計來處理請求的，如下圖所示：

假如請求分別經過CDN、前臺讀系統（如商品詳情）、後臺系統（如交易系統）和數據庫這幾層，那麼：

大部分數據和流量在用戶瀏覽器或者CDN上獲取，這一層可以攔截大部分數據的讀取；
經過第二層（即前臺系統）時數據（包括強一致性的數據）儘量得走Cache，過濾一些無效的請求；
再到第三層後臺系統，主要做數據的二次檢驗，對系統做好保護和限流，這樣數據量和請求就進一步減少；
最後在數據層完成數據的強一致性校驗。

這樣就像漏斗一樣，儘量把數據量和請求量一層一層地過濾和減少了

分層過濾的核心思想是：在不同的層次儘可能地過濾掉無效請求，讓“漏斗”最末端的纔是有效請求；而要達到這種效果，我們就必須對數據做分層的校驗

分層校驗的基本原則是：

將動態請求的讀數據緩存（Cache）在Web端，過濾掉無效的數據讀；
對讀數據不做強一致性校驗，減少因爲一致性校驗產生瓶頸的問題；
對寫數據進行基於時間的合理分片，過濾掉過期的失效請求；
對寫請求做限流保護，將超出系統承載能力的請求過濾掉；
對寫數據進行強一致性校驗，只保留最後有效的數據。

分層校驗的目的是：

在讀系統中，儘量減少由於一致性校驗帶來的系統瓶頸，但是儘量將不影響性能的檢查條件提前，如用戶是否具有秒殺資格、商品狀態是否正常、用戶答題是否正確、秒殺是否已經結束、是否非法請求、營銷等價物是否充足等；在寫數據系統中，主要對寫的數據（如庫存）做一致性檢查，最後在數據庫層保證數據的最終準確性（如庫存不能減爲負數）

總結

本篇博客介紹瞭如何在網站面臨大流量衝擊時進行請求的削峯，並主要介紹了削峯的3種處理方式：

一個是通過隊列來緩衝請求，即控制請求的發出；

一個是通過答題來延長請求發出的時間，在請求發出後承接請求時進行控制，最後再對不符合條件的請求進行過濾；

最後一種是對請求進行分層過濾。

其中，隊列緩衝方式更加通用，它適用於內部上下游系統之間調用請求不平緩的場景，由於內部系統的服務質量要求不能隨意丟棄請求，所以使用消息隊列能起到很好的削峯和緩衝作用

而答題更適用於秒殺或者營銷活動等應用場景，在請求發起端就控制發起請求的速度，因爲越到後面無效請求也會越多，所以配合後面介紹的分層攔截的方式，可以更進一步減少無效請求對系統資源的消耗

分層過濾非常適合交易性的寫請求，比如減庫存或者拼車這種場景，在讀的時候需要知道還有沒有庫存或者是否還有剩餘空座位。但是由於庫存和座位又是不停變化的，所以讀的數據是否一定要非常準確呢？其實不一定，你可以放一些請求過去，然後在真正減的時候再做強一致性保證，這樣既過濾一些請求又解決了強一致性讀的瓶頸。

不過，在削峯的處理方式上除了採用技術手段，其實還可以採用業務手段來達到一定效果，例如在零點開啓大促的時候由於流量太大導致支付系統阻塞，這個時候可以採用發放優惠券、發起抽獎活動等方式，將一部分流量分散到其他地方，這樣也能起到緩衝流量的作用

【商城秒殺項目】-- 流量削峯應該怎麼做

移位操作搞定兩數之商

如何基於surging跨網關跨語言進行緩存降級

2024合集

程序員天天 CURD，怎麼才能成長，職業發展的思考(2)

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

通用代碼生成器簡介

lightdb 單機模式下數據庫平移

千兆寬帶實際網速能到達多少？

關於springboot項目使用@Transactional註解事務不回滾的問題

【商城秒殺項目】-- 對返回json結果的封裝、通用緩存Key的設計與封裝

服務治理組件Eureka簡介、初步使用

Hystrix斷路器簡介及應用

Hystrix集羣監控Turbine

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結