【原創】分佈式之一行代碼解決緩存擊穿問題

引言

今天,重新回顧一下緩存擊穿這個問題!
之所以寫這個文章呢,因爲目前網上流傳的文章落地性太差(什麼布隆過濾器啊,布穀過濾器啊,嗯,你們懂的),其實這類方案並不適合在項目中直接落地。

那麼,我們在項目中落地代碼的時候,其實只需要一個註解就能解決這些問題,並不需要搞的那麼複雜。

本文有一個前提,讀者必須是java棧,且是用Springboot構建自己的項目,如果是go技術棧或者python技術棧的,可能介紹的思路僅供大家參考!

正文

目前缺陷

首先,爲什麼說目前網上流傳的方案,落地性差呢,因爲都缺乏一個可以和SpringBoot結合起來的真實場景,基本上都脫離了SpringBoot,只站在Java這個層級去分析。那問題就來了,現在還有隻用SpringMvc,卻不用SpringBoot的公司麼?因此,本文嘗試將該方案和SpringBoot結合起來,講一個確實可行,可以落地的方案!

當然,我們先來說說目前在網上流傳的幾套方案,到底不靠譜在哪裏!

(1)布隆過濾器

關於布隆過濾器,我就不介紹太多,這裏就理解爲是一個過濾器,用於快速檢索一個元素是否在一個集合中;那麼當一個請求來的時候,快速判斷這個請求的key是否在指定集合中!如果在,說明有效,則放行。如果不在,則無效攔截。
至於實現,各大博客也說了用了google提供的

<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>19.0</version>
</dependency>

這個包裏有現成寫好的java類給你使用了,當然demo代碼我就不貼了,一抓一大把!
當然,似乎看上去完美無暇!一切都是那麼的合適!

然而到這裏,我就真的問一句,你們真的用了這個方案了?

我如果猜的沒錯,應該沒幾個人遇到過緩存擊穿問題~

更何況,證明這個說法的正確性~

該方案最大的一個問題是布隆過濾器不支持反向刪除操作,例如你的項目裏活躍的key的數量只有1000w個,但是全部key數量有5000w個,那這5000w個key會全部存在布隆過濾器裏!

直到某一天,你會發現這個過濾器太擁擠了,誤判率太高,不得不進行重建!

so,你們覺得這個做法真的靠譜?

那麼布隆過濾器這個說法出自哪裏呢?
(大家一定很好奇對不對!)

當然是xx機構~~此處保護自己的狗頭~~記住,他們爲了割韭菜,一定會選擇一些看起來極爲高端,但是落地巨不靠譜的方案(這也是區分一個機構到底是割韭菜還是真正有水平的標杆,小白不懂,很容易被坑)~~看到這裏,真是慚愧,我的第一篇文章也是寫這個方案了,但是在落地過程中,發現了不對勁(此處省略一萬字的檢討文,煙哥垃圾~~)。

(2)布穀過濾器

那麼,爲了解決布隆過濾器查詢性能弱、空間利用效率低、不支持反向操作等問題,又有一篇文章誕生了,主張用布穀過濾器來解決緩存擊穿問題!

但是,神奇的事情來了,基本上所有的文章都在說布穀過濾器多麼多麼牛逼,卻沒有任何落地的方案~

記住,我們平時寫代碼,一定是怎麼方便怎麼來!再記住,面試是一回事,代碼落地是另一回事~

那,真正簡便的方案是什麼樣的呢?來,我們一步步來~

真正方案

假設,你此刻用的是springboot-2.x的版本,你爲了能夠連接redis,你在pom文件里加入如下依賴

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>

然後呢,我們修改application.yml

spring:
  datasource:
    ...
  redis:
    database: ...
    host: ...
    port: ...
(省事,不全貼了)

ok,說到這裏,就不得不說一下spring-cache了,Spring3.1之後,引入了註解緩存技術,其本質上不是一個具體的緩存實現方案,而是一個對緩存使用的抽象,通過在既有代碼中添加少量自定義的各種annotation,即能夠達到使用緩存對象和緩存方法的返回對象的效果。Spring的緩存技術具備相當的靈活性,不僅能夠使用SpEL(Spring Expression Language)來定義緩存的key和各種condition,還提供開箱即用的緩存臨時存儲方案,也支持和主流的專業緩存集成。

例如:我們在代碼中經常有這麼一段邏輯,在目標方法執行前,會根據key先去緩存中查詢看是否有數據,有就直接返回緩存中的key對應的value值,不再執行目標方法;沒有則執行目標方法,去數據庫查詢出對應的value,並以鍵值對的形式存入緩存。

如果我們不使用例如spring-cache的註解框架,你的代碼中會充斥着大量冗餘代碼,而用了該框架後,以@Cacheable註解爲例, 該註解在方法上,表示該方法的返回結果是可以緩存的。

也就是說,該方法的返回結果會放在緩存中,以便於以後使用相同的參數調用該方法時,會返回緩存中的值,而不會實際執行該方法。

那麼,你的代碼只需要這麼寫

@Override
@Cacheable("menu")
public Menu findById(String id) {
    Menu menu = this.getById(id);
    if (menu != null){
        System.out.println("menu.name = " + menu.getName());
    }
    return menu;
}

在這個例子中,findById 方法與一個名爲 menu 的緩存關聯起來了。調用該方法時,會檢查 menu 緩存,如果緩存中有結果,就不會去執行方法了。

ok,說到這裏,其實都是大家懂得東西!!接下來開始我們的主題:如何解決緩存擊穿問題!順便講講穿透和雪崩問題!

來來來,我們回憶一下緩存擊穿,穿透以及緩存雪崩的概念!

緩存穿透

在高併發下,查詢一個不存在的值時,緩存不會被命中,導致大量請求直接落到數據庫上,如活動系統裏面查詢一個不存在的活動。
多嘴一句:緩存穿透是指,請求的是緩存和數據庫中都沒有的數據!

對於緩存穿透問題,有一個很簡單的解決方案,就是緩存NULL值~從緩存取不到的數據,在數據庫中也沒有取到,直接返回空值。

那麼spring-cache中,有一個配置是這樣的

spring.cache.redis.cache-null-values=true

帶上該配置後,就可以緩存null值了,值得一提的是,這個緩存時間要設的少一點,例如15秒就夠,如果設置過長,會導致正常的緩存也無法使用。

緩存擊穿

在高併發下,對一個特定的值進行查詢,但是這個時候緩存正好過期了,緩存沒有命中,導致大量請求直接落到數據庫上,如活動系統裏面查詢活動信息,但是在活動進行過程中活動緩存突然過期了。
多嘴一句:緩存擊穿是指,請求的是緩存沒有,而數據庫中有的數據!

記住,解決擊穿的最簡單的方法,只有一個,就是限流!至於怎麼限,其實可以各顯神通!例如其他文章提到的布隆過濾器,布穀過濾器等,不過是限流方式之一而已!甚至,你用一些其他的限流組件也是可以的!

這裏就要說spring-cahce的另一個配置了!

在緩存過期之後,如果多個線程同時請求對某個數據的訪問,會同時去到數據庫,導致數據庫瞬間負荷增高。Spring4.3爲@Cacheable註解提供了一個新的參數“sync”(boolean類型,缺省爲false),當設置它爲true時,只有一個線程的請求會去到數據庫,其他線程都會等待直到緩存可用。這個設置可以減少對數據庫的瞬間併發訪問。

看到這裏!!這不就是一個限流方案麼?

所以解決方法就是,加一個屬性sync=true,就行。代碼就像下面這樣

@Cacheable(cacheNames="menu", sync="true")

用了該屬性後,可以指示底層將緩存鎖住,使只有一個線程可以進入計算,而其他線程堵塞,直到返回結果更新到緩存中。

當然,看到這裏,一定會有人和我擡槓!他的問題是這樣的!

你這個只是針對單機的限流,並不是整體集羣的限流!也就是說,假設你的集羣搭建了3000個pod,最差的情況下就是,3000個pod上,每個pod都會發起一個請求去數據庫查詢,照樣還是會導致數據庫連接數不夠用,等等資源問題!

對於這個問題我只能說!少年,但凡你的公司產品達到這種流量規模,此刻你就不會在看我的文章!你此刻關心的問題是:

(1)哎,買深圳灣一號還是深圳灣公館呢,糾結!
(2)昨天美股又跌了,又損失了兩套房
(3)昨天提前撤單了,又少掙了幾萬
....(省略一萬字)

當然,如果你非要解決,也有辦法。spring的aop有套路的,比如@Transactional的Advice是TransactionInterceptor,那麼cache也對應對一個CacheInterceptor,我們只要去改CacheInterceptor,這個切面就能解決。在裏頭做一個分佈式鎖!僞代碼如下

flag := 取分佈式鎖
if flag {
    走數據庫查詢,並緩存結果
}{
    睡眠一段時間,再次嘗試獲取key的值
}

但是,我還是要多嘴提一句,真沒必要~~
記住一句話,立足實際出發~但凡你的業務到了那種級別,是可以做到區域部署的,完全可以規避開這類問題。

緩存雪崩

在高併發下,大量的緩存key在同一時間失效,導致大量的請求落到數據庫上,如活動系統裏面同時進行着非常多的活動,但是在某個時間點所有的活動緩存全部過期。

那麼針對該問題,最簡單的解決方法就是,過期時間加隨機值!

但是很麻煩的是,我們在使用@Cacheable註解的時候,原生功能沒法直接設置隨機過期時間的。

這個老實說,真沒啥好方法,只能自己繼承RedisCache,對其增強,改寫其中的put方法,帶上隨機時間!

(本文不贅述,自己可以去查閱相關博客,我真的不喜歡寫文章貼大量代碼,可讀性太差了,知道這麼個思路就行,出門搜索一下,一堆答案!)

文末

自此,緩存擊穿,穿透,雪崩問題都得到圓滿解決~~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章