深度掌握Redis:5 大難題解決方案+單線程優劣勢+高併發快原因

這大概是最詳細的一篇關於Redis文章了,分享給熱愛鑽研技術的童鞋們~

    轉載    https://studygolang.com/topics/8514

一、Redis雪崩、穿透、併發等5大難題解決方案

緩存雪崩

數據未加載到緩存中,或者緩存同一時間大面積的失效,從而導致所有請求都去查數據庫,導致數據庫CPU和內存負載過高,甚至宕機。

比如一個雪崩的簡單過程:

1、redis集羣大面積故障;

2、緩存失效,但依然大量請求訪問緩存服務redis;

3、redis大量失效後,大量請求轉向到mysql數據庫;

4、mysql的調用量暴增,很快就扛不住了,甚至直接宕機;

5、由於大量的應用服務依賴mysql和redis的服務,這個時候很快會演變成各服務器集羣的雪崩,最後網站徹底崩潰。
image

如何預防緩存雪崩:
image

1.緩存的高可用性

緩存層設計成高可用,防止緩存大面積故障。即使個別節點、個別機器、甚至是機房宕掉,依然可以提供服務,例如 Redis Sentinel 和 Redis Cluster 都實現了高可用。

2.緩存降級

可以利用ehcache等本地緩存(暫時支持),但主要還是對源服務訪問進行限流、資源隔離(熔斷)、降級等。 當訪問量劇增、服務出現問題仍然需要保證服務還是可用的。系統可以根據一些關鍵數據進行自動降級,也可以配置開關實現人工降級,這裏會涉及到運維的配合。

降級的最終目的是保證核心服務可用,即使是有損的。比如推薦服務中,很多都是個性化的需求,假如個性化需求不能提供服務了,可以降級補充熱點數據,不至於造成前端頁面是個大空白。

在進行降級之前要對系統進行梳理,比如:哪些業務是核心(必須保證),哪些業務可以容許暫時不提供服務(利用靜態頁面替換)等,以及配合服務器核心指標,來後設置整體預案,比如:

(1)一般:比如有些服務偶爾因爲網絡抖動或者服務正在上線而超時,可以自動降級; (2)警告:有些服務在一段時間內成功率有波動(如在95~100%之間),可以自動降級或人工降級,併發送告警; (3)錯誤:比如可用率低於90%,或者數據庫連接池被打爆了,或者訪問量突然猛增到系統能承受的最大閥值,此時可以根據情況自動降級或者人工降級; (4)嚴重錯誤:比如因爲特殊原因數據錯誤了,此時需要緊急人工降級。

3.Redis備份和快速預熱

Redis數據備份和恢復;
快速緩存預熱。
4.提前演練

最後,建議還是在項目上線前,演練緩存層宕掉後,應用以及後端的負載情況以及可能出現的問題,對高可用提前預演,提前發現問題。

緩存穿透

緩存穿透是指查詢一個一不存在的數據。例如:從緩存redis沒有命中,需要從mysql數據庫查詢,查不到數據則不寫入緩存,這將導致這個不存在的數據每次請求都要到數據庫去查詢,造成緩存穿透。

解決思路: 如果查詢數據庫也爲空,直接設置一個默認值存放到緩存,這樣第二次到緩衝中獲取就有值了,而不會繼續訪問數據庫。設置一個過期時間或者當有值的時候將緩存中的值替換掉即可。

可以給key設置一些格式規則,然後查詢之前先過濾掉不符合規則的Key。

緩存併發

這裏的併發指的是多個redis的client同時set key引起的併發問題。其實redis自身就是單線程操作,多個client併發操作,按照先到先執行的原則,先到的先執行,其餘的阻塞。當然,另外的解決方案是把redis.set操作放在隊列中使其串行化,必須的一個一個執行。

緩存預熱

緩存預熱就是系統上線後,將相關的緩存數據直接加載到緩存系統。

這樣就可以避免在用戶請求的時候,先查詢數據庫,然後再將數據緩存的問題!用戶直接查詢事先被預熱的緩存數據!

解決思路:

直接寫個緩存刷新頁面,上線時手工操作下;
數據量不大,可以在項目啓動的時候自動進行加載;
目的就是在系統上線前,將數據加載到緩存中。

二、Redis爲什麼是單線程,高併發快的3大原因詳解

Redis的高併發和快速原因

1.redis是基於內存的,內存的讀寫速度非常快; 2.redis是單線程的,省去了很多上下文切換線程的時間; 3.redis使用多路複用技術,可以處理併發的連接。非阻塞IO 內部實現採用epoll,採用了epoll+自己實現的簡單的事件框架。epoll中的讀、寫、關閉、連接都轉化成了事件,然後利用epoll的多路複用特性,絕不在io上浪費一點時間。

下面重點介紹單線程設計和IO多路複用核心設計快的原因。
image

爲什麼Redis是單線程的?

1.官方答案

因爲Redis是基於內存的操作,CPU不是Redis的瓶頸,Redis的瓶頸最有可能是機器內存的大小或者網絡帶寬。既然單線程容易實現,而且CPU不會成爲瓶頸,那就順理成章地採用單線程的方案了。

2.性能指標

關於redis的性能,官方網站也有,普通筆記本輕鬆處理每秒幾十萬的請求。

3.詳細原因

1)不需要各種鎖的性能消耗

Redis的數據結構並不全是簡單的Key-Value,還有list,hash等複雜的結構,這些結構有可能會進行很細粒度的操作,比如在很長的列表後面添加一個元素,在hash當中添加或者刪除

一個對象。這些操作可能就需要加非常多的鎖,導致的結果是同步開銷大大增加。

總之,在單線程的情況下,就不用去考慮各種鎖的問題,不存在加鎖釋放鎖操作,沒有因爲可能出現死鎖而導致的性能消耗。

2)單線程多進程集羣方案

單線程的威力實際上非常強大,每核心效率也非常高,多線程自然是可以比單線程有更高的性能上限,但是在今天的計算環境中,即使是單機多線程的上限也往往不能滿足需要了,需要進一步摸索的是多服務器集羣化的方案,這些方案中多線程的技術照樣是用不上的。

所以單線程、多進程的集羣不失爲一個時髦的解決方案。

3)CPU消耗

採用單線程,避免了不必要的上下文切換和競爭條件,也不存在多進程或者多線程導致的切換而消耗 CPU。

但是如果CPU成爲Redis瓶頸,或者不想讓服務器其他CUP核閒置,那怎麼辦?

可以考慮多起幾個Redis進程,Redis是key-value數據庫,不是關係數據庫,數據之間沒有約束。只要客戶端分清哪些key放在哪個Redis進程上就可以了。

Redis單線程的優劣勢

單進程單線程優勢

代碼更清晰,處理邏輯更簡單不用去考慮各種鎖的問題,不存在加鎖釋放鎖操作,沒有因爲可能出現死鎖而導致的性能消耗不存在多進程或者多線程導致的切換而消耗CPU。

單進程單線程弊端

無法發揮多核CPU性能,不過可以通過在單機開多個Redis實例來完善。

IO多路複用技術

redis 採用網絡IO多路複用技術來保證在多連接的時候, 系統的高吞吐量。

多路-指的是多個socket連接,複用-指的是複用一個線程。多路複用主要有三種技術:select,poll,epoll。epoll是最新的也是目前最好的多路複用技術。

這裏“多路”指的是多個網絡連接,“複用”指的是複用同一個線程。採用多路 I/O 複用技術可以讓單個線程高效的處理多個連接請求(儘量減少網絡IO的時間消耗),且Redis在內存中操作數據的速度非常快(內存內的操作不會成爲這裏的性能瓶頸),主要以上兩點造就了Redis具有很高的吞吐量。

image

Redis高併發快總結
image

  1. Redis是純內存數據庫,一般都是簡單的存取操作,線程佔用的時間很多,時間的花費主要集中在IO上,所以讀取速度快。

  2. 再說一下IO,Redis使用的是非阻塞IO,IO多路複用,使用了單線程來輪詢描述符,將數據庫的開、關、讀、寫都轉換成了事件,減少了線程切換時上下文的切換和競爭。

  3. Redis採用了單線程的模型,保證了每個操作的原子性,也減少了線程的上下文切換和競爭。

  4. 另外,數據結構也幫了不少忙,Redis全程使用hash結構,讀取速度快,還有一些特殊的數據結構,對數據存儲進行了優化,如壓縮表,對短數據進行壓縮存儲,再如,跳錶,使用有序的數據結構加快讀取的速度。

  5. 還有一點,Redis採用自己實現的事件分離器,效率比較高,內部採用非阻塞的執行方式,吞吐能力比較大。

三、Redis緩存和MySQL數據一致性方案詳解

需求起因

在高併發的業務場景下,數據庫大多數情況都是用戶併發訪問最薄弱的環節。所以,就需要使用redis做一個緩衝操作,讓請求先訪問到redis,而不是直接訪問MySQL等數據庫。
image

這個業務場景,主要是解決讀數據從Redis緩存,一般都是按照下圖的流程來進行業務操作。

image

讀取緩存步驟一般沒有什麼問題,但是一旦涉及到數據更新:數據庫和緩存更新,就容易出現緩存(Redis)和數據庫(MySQL)間的數據一致性問題。

不管是先寫MySQL數據庫,再刪除Redis緩存;還是先刪除緩存,再寫庫,都有可能出現數據不一致的情況。舉一個例子:

1.如果刪除了緩存Redis,還沒有來得及寫庫MySQL,另一個線程就來讀取,發現緩存爲空,則去數據庫中讀取數據寫入緩存,此時緩存中爲髒數據。

2.如果先寫了庫,在刪除緩存前,寫庫的線程宕機了,沒有刪除掉緩存,則也會出現數據不一致情況。

因爲寫和讀是併發的,沒法保證順序,就會出現緩存和數據庫的數據不一致的問題。如何解決?這裏給出兩個解決方案,先易後難,結合業務和技術代價選擇使用。

緩存和數據庫一致性解決方案

1.第一種方案:採用延時雙刪策略

在寫庫前後都進行redis.del(key)操作,並且設定合理的超時時間。 僞代碼如下:

public void write(String key,Object data){
 redis.delKey(key);
 db.updateData(data);
 Thread.sleep(500);
 redis.delKey(key);
 }

具體的步驟就是: 先刪除緩存;再寫數據庫;休眠500毫秒;再次刪除緩存。

那麼,這個500毫秒怎麼確定的,具體該休眠多久呢?

需要評估自己的項目的讀數據業務邏輯的耗時。這麼做的目的,就是確保讀請求結束,寫請求可以刪除讀請求造成的緩存髒數據。

當然這種策略還要考慮redis和數據庫主從同步的耗時。最後的的寫數據的休眠時間:則在讀數據業務邏輯的耗時基礎上,加幾百ms即可。比如:休眠1秒。

設置緩存過期時間

從理論上來說,給緩存設置過期時間,是保證最終一致性的解決方案。所有的寫操作以數據庫爲準,只要到達緩存過期時間,則後面的讀請求自然會從數據庫中讀取新值然後回填緩存。

該方案的弊端

結合雙刪策略+緩存超時設置,這樣最差的情況就是在超時時間內數據存在不一致,而且又增加了寫請求的耗時。

2、第二種方案:異步更新緩存(基於訂閱binlog的同步機制)

技術整體思路:

MySQL binlog增量訂閱消費+消息隊列+增量數據更新到redis 讀Redis:熱數據基本都在Redis寫MySQL:增刪改都是操作MySQL更新Redis數據:MySQ的數據操作binlog,來更新到Redis。

Redis更新

1)數據操作主要分爲兩大塊

一個是全量(將全部數據一次寫入到redis)一個是增量(實時更新) 這裏說的是增量,指的是mysql的update、insert、delate變更數據。

2)讀取binlog後分析 ,利用消息隊列,推送更新各臺的redis緩存數據。

這樣一旦MySQL中產生了新的寫入、更新、刪除等操作,就可以把binlog相關的消息推送至Redis,Redis再根據binlog中的記錄,對Redis進行更新。

其實這種機制,很類似MySQL的主從備份機制,因爲MySQL的主備也是通過binlog來實現的數據一致性。

這裏可以結合使用canal(阿里的一款開源框架),通過該框架可以對MySQL的binlog進行訂閱,而canal正是模仿了mysql的slave數據庫的備份請求,使得Redis的數據更新達到了相同的效果。

當然,這裏的消息推送工具你也可以採用別的第三方:kafka、rabbitMQ等來實現推送更新Redis。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章