分佈式之 Redis 複習精講

正文

1、爲什麼使用redis

分析:博主覺得在項目中使用redis,主要是從兩個角度去考慮:性能併發。當然,redis還具備可以做分佈式鎖等其他功能,但是如果只是爲了分佈式鎖這些其他功能,完全還有其他中間件(如zookpeer等)代替,並不是非要使用redis。因此,這個問題主要從性能和併發兩個角度去答。
回答:如下所示,分爲兩點
(一)性能
如下圖所示,我們在碰到需要執行耗時特別久,且結果不頻繁變動的SQL,就特別適合將運行結果放入緩存。這樣,後面的請求就去緩存中讀取,使得請求能夠迅速響應
image
題外話:忽然想聊一下這個迅速響應的標準。其實根據交互效果的不同,這個響應時間沒有固定標準。不過曾經有人這麼告訴我:”在理想狀態下,我們的頁面跳轉需要在瞬間解決,對於頁內操作則需要在剎那間解決。另外,超過一彈指的耗時操作要有進度提示,並且可以隨時中止或取消,這樣才能給用戶最好的體驗。”
那麼瞬間、剎那、一彈指具體是多少時間呢?
根據《摩訶僧祗律》記載

1

一剎那者爲一念,二十念爲一瞬,二十瞬爲一彈指,二十彈指爲一羅預,二十羅預爲一須臾,一日一夜有三十須臾。

那麼,經過周密的計算,一瞬間爲0.36 秒,一剎那有 0.018 秒.一彈指長達 7.2 秒。
(二)併發
如下圖所示,在大併發的情況下,所有的請求直接訪問數據庫,數據庫會出現連接異常。這個時候,就需要使用redis做一個緩衝操作,讓請求先訪問到redis,而不是直接訪問數據庫。
image

2、使用redis有什麼缺點

分析:大家用redis這麼久,這個問題是必須要了解的,基本上使用redis都會碰到一些問題,常見的也就幾個。
回答:主要是四個問題
(一)緩存和數據庫雙寫一致性問題
(二)緩存雪崩問題
(三)緩存擊穿問題
(四)緩存的併發競爭問題
這四個問題,我個人是覺得在項目中,比較常遇見的,具體解決方案,後文給出。

3、單線程的redis爲什麼這麼快

分析:這個問題其實是對redis內部機制的一個考察。其實根據博主的面試經驗,很多人其實都不知道redis是單線程工作模型。所以,這個問題還是應該要複習一下的。
回答:主要是以下三點
(一)純內存操作
(二)單線程操作,避免了頻繁的上下文切換
(三)採用了非阻塞I/O多路複用機制

題外話:我們現在要仔細的說一說I/O多路複用機制,因爲這個說法實在是太通俗了,通俗到一般人都不懂是什麼意思。博主打一個比方:小曲在S城開了一家快遞店,負責同城快送服務。小曲因爲資金限制,僱傭了一批快遞員,然後小曲發現資金不夠了,只夠買一輛車送快遞。
經營方式一
客戶每送來一份快遞,小曲就讓一個快遞員盯着,然後快遞員開車去送快遞。慢慢的小曲就發現了這種經營方式存在下述問題

  • 幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閒置狀態,誰搶到了車,誰就能去送快遞

  • 隨着快遞的增多,快遞員也越來越多,小曲發現快遞店裏越來越擠,沒辦法僱傭新的快遞員了

  • 快遞員之間的協調很花時間

綜合上述缺點,小曲痛定思痛,提出了下面的經營方式
經營方式二
小曲只僱傭一個快遞員。然後呢,客戶送來的快遞,小曲按送達地點標註好,然後依次放在一個地方。最後,那個快遞員依次的去取快遞,一次拿一個,然後開着車去送快遞,送好了就回來拿下一個快遞。

對比
上述兩種經營方式對比,是不是明顯覺得第二種,效率更高,更好呢。在上述比喻中:

  • 每個快遞員——————>每個線程

  • 每個快遞——————–>每個socket(I/O流)

  • 快遞的送達地點————–>socket的不同狀態

  • 客戶送快遞請求————–>來自客戶端的請求

  • 小曲的經營方式————–>服務端運行的代碼

  • 一輛車———————->CPU的核數

於是我們有如下結論
1、經營方式一就是傳統的併發模型,每個I/O流(快遞)都有一個新的線程(快遞員)管理。
2、經營方式二就是I/O多路複用。只有單個線程(一個快遞員),通過跟蹤每個I/O流的狀態(每個快遞的送達地點),來管理多個I/O流。

下面類比到真實的redis線程模型,如圖所示
image
參照上圖,簡單來說,就是。我們的redis-client在操作的時候,會產生具有不同事件類型的socket。在服務端,有一段I/0多路複用程序,將其置入隊列之中。然後,文件事件分派器,依次去隊列中取,轉發到不同的事件處理器中。
需要說明的是,這個I/O多路複用機制,redis還提供了select、epoll、evport、kqueue等多路複用函數庫,大家可以自行去了解。

4、redis的數據類型,以及每種數據類型的使用場景

分析:是不是覺得這個問題很基礎,其實我也這麼覺得。然而根據面試經驗發現,至少百分八十的人答不上這個問題。建議,在項目中用到後,再類比記憶,體會更深,不要硬記。基本上,一個合格的程序員,五種類型都會用到。
回答:一共五種
(一)String
這個其實沒啥好說的,最常規的set/get操作,value可以是String也可以是數字。一般做一些複雜的計數功能的緩存。
(二)hash
這裏value存放的是結構化的對象,比較方便的就是操作其中的某個字段。博主在做單點登錄的時候,就是用這種數據結構存儲用戶信息,以cookieId作爲key,設置30分鐘爲緩存過期時間,能很好的模擬出類似session的效果。
(三)list
使用List的數據結構,可以做簡單的消息隊列的功能。另外還有一個就是,可以利用lrange命令,做基於redis的分頁功能,性能極佳,用戶體驗好。
(四)set
因爲set堆放的是一堆不重複值的集合。所以可以做全局去重的功能。爲什麼不用JVM自帶的Set進行去重?因爲我們的系統一般都是集羣部署,使用JVM自帶的Set,比較麻煩,難道爲了一個做一個全局去重,再起一個公共服務,太麻煩了。
另外,就是利用交集、並集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能
(五)sorted set
sorted set多了一個權重參數score,集合中的元素能夠按score進行排列。可以做排行榜應用,取TOP N操作。另外,參照另一篇《分佈式之延時任務方案解析》,該文指出了sorted set可以用來做延時任務。最後一個應用就是可以做範圍查找

5、redis的過期策略以及內存淘汰機制

分析:這個問題其實相當重要,到底redis有沒用到家,這個問題就可以看出來。比如你redis只能存5G數據,可是你寫了10G,那會刪5G的數據。怎麼刪的,這個問題思考過麼?還有,你的數據已經設置了過期時間,但是時間到了,內存佔用率還是比較高,有思考過原因麼?
回答:
redis採用的是定期刪除+惰性刪除策略。
爲什麼不用定時刪除策略?
定時刪除,用一個定時器來負責監視key,過期則自動刪除。雖然內存及時釋放,但是十分消耗CPU資源。在大併發請求下,CPU要將時間應用在處理請求,而不是刪除key,因此沒有采用這一策略.
定期刪除+惰性刪除是如何工作的呢?
定期刪除,redis默認每個100ms檢查,是否有過期的key,有過期key則刪除。需要說明的是,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死)。因此,如果只採用定期刪除策略,會導致很多key到時間沒有刪除。
於是,惰性刪除派上用場。也就是說在你獲取某個key的時候,redis會檢查一下,這個key如果設置了過期時間那麼是否過期了?如果過期了此時就會刪除。
採用定期刪除+惰性刪除就沒其他問題了麼?
不是的,如果定期刪除沒刪除key。然後你也沒即時去請求key,也就是說惰性刪除也沒生效。這樣,redis的內存會越來越高。那麼就應該採用內存淘汰機制
在redis.conf中有一行配置

1

# maxmemory-policy volatile-lru

該配置就是配內存淘汰策略的(什麼,你沒配過?好好反省一下自己)
1)noeviction:當內存不足以容納新寫入數據時,新寫入操作會報錯。應該沒人用吧。
2)allkeys-lru:當內存不足以容納新寫入數據時,在鍵空間中,移除最近最少使用的key。推薦使用,目前項目在用這種。
3)allkeys-random:當內存不足以容納新寫入數據時,在鍵空間中,隨機移除某個key。應該也沒人用吧,你不刪最少使用Key,去隨機刪。
4)volatile-lru:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,移除最近最少使用的key。這種情況一般是把redis既當緩存,又做持久化存儲的時候才用。不推薦
5)volatile-random:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,隨機移除某個key。依然不推薦
6)volatile-ttl:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,有更早過期時間的key優先移除。不推薦
ps:如果沒有設置 expire 的key, 不滿足先決條件(prerequisites); 那麼 volatile-lru, volatile-random 和 volatile-ttl 策略的行爲, 和 noeviction(不刪除) 基本上一致。

6、redis和數據庫雙寫一致性問題

分析:一致性問題是分佈式常見問題,還可以再分爲最終一致性和強一致性。數據庫和緩存雙寫,就必然會存在不一致的問題。答這個問題,先明白一個前提。就是如果對數據有強一致性要求,不能放緩存。我們所做的一切,只能保證最終一致性。另外,我們所做的方案其實從根本上來說,只能說降低不一致發生的概率,無法完全避免。因此,有強一致性要求的數據,不能放緩存。
回答:《分佈式之數據庫和緩存雙寫一致性方案解析》給出了詳細的分析,在這裏簡單的說一說。首先,採取正確更新策略,先更新數據庫,再刪緩存。其次,因爲可能存在刪除緩存失敗的問題,提供一個補償措施即可,例如利用消息隊列。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章