Redis-基於內存的高性能數據庫

參考教程

  1. Redis中文網址:https://www.redis.net.cn/tutorial/3502.html
  2. 爲什麼分佈式一定要有redis?:https://www.cnblogs.com/bigben0123/p/9115597.html
  3. Redis【入門】:https://www.jianshu.com/p/56999f2b8e3b

一、特點

Redis 是完全開源免費的,遵守BSD協議,是一個高性能的key-value數據庫。與其他 key - value 緩存產品有以下三個特點:

  1. 支持數據的持久化,可以將內存中的數據保持在磁盤中,重啓的時候可以再次加載進行使用。
  2. 支持五種數據類型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合)。
  3. 性能優越,可以支持每秒十幾萬次的讀/寫操作,其性能遠超數據庫,並且還支持集羣、分佈式、主從同步等配置,原則上可以無限擴展,讓更多的數據存儲在內存中。
  4. 支持一定的事務能力,保證了高併發的場景下數據的安全和一致性。

二、應用場景

1. 性能

在日常對數據庫的訪問中,讀操作的次數遠超寫操作,比例大概在 1:9 到 3:7。使用SQL語句去數據庫進行讀寫操作,數據庫會去磁盤把對應的數據索引取回來,這是一個相對較慢的過程。

碰到需要執行耗時特別久,且結果不頻繁變動的SQL,就特別適合將運行結果放入緩存。這樣,後面的請求就去緩存中讀取,使得請求能夠迅速響應。
如果把數據放在 Redis 中(也即內存中),服務端直接去讀取內存中的數據,速度會明顯加快,並且會極大減小數據庫的壓力。

但使用內存進行數據存儲開銷也是比較大的,限於成本的原因,一般只是使用 Redis 存儲一些常用和主要的數據,比如用戶登錄的信息等。

一般而言在使用 Redis 進行存儲的時候,需要從以下幾個方面來考慮:

  1. 業務數據常用嗎?命中率如何?如果命中率很低,就沒有必要寫入緩存;
  2. 該業務數據是讀操作多,還是寫操作多?如果寫操作多,頻繁需要寫入數據庫,也沒有必要使用緩存;
  3. 業務數據大小如何?如果要存儲幾百兆字節的文件,會給緩存帶來很大的壓力,這樣也沒有必要;

使用 Redis 作爲緩存的讀取邏輯
使用 Redis 作爲緩存的讀取邏輯
使用 Redis 作爲緩存的寫操作邏輯
寫操作的流程

2. 併發

在大併發的情況下,所有的請求直接訪問數據庫,處理會非常慢,數據庫可能會出現連接異常(甚至崩掉)。這個時候,就需要使用redis做一個緩衝操作,讓請求先訪問到redis,而不是直接訪問數據庫。

  1. 當請求到達服務器時,只是把業務數據在 Redis 上進行讀寫,而不對數據庫進行任何的操作,能大大提高讀寫的速度,滿足高速響應的需求;
  2. 但這些緩存的數據仍然需要持久化,也就是存入數據庫之中。所以在一個請求操作完 Redis 的讀/寫之後,會去判斷該高速讀/寫的業務是否結束,這個判斷通常會在秒殺商品爲0,紅包金額爲0時成立,如果不成立,則不會操作數據庫;如果成立,則觸發事件將 Redis 的緩存的數據以批量的形式一次性寫入數據庫,從而完成持久化的工作。

使用緩存的請求操作流程
一次請求操作的流程圖

相關問題

1. 使用redis有什麼缺點
主要是四個問題
(一)緩存和數據庫雙寫一致性問題
(二)緩存雪崩問題
(三)緩存擊穿問題
(四)緩存的併發競爭問題

2. 單線程的redis爲什麼這麼快
主要是以下三點
(一)純內存操作
(二)單線程操作,避免了頻繁的上下文切換
(三)採用了非阻塞I/O多路複用機制
在這裏插入圖片描述
參照上圖,redis-client在操作的時候,會產生具有不同事件類型的socket。在服務端,有一段I/0多路複用程序,將其置入隊列之中。然後,文件事件分派器,依次去隊列中取,轉發到不同的事件處理器中。
關於I/O多路複用機制,redis還提供了select、epoll、evport、kqueue等多路複用函數庫。

3. redis的數據類型,以及每種數據類型的使用場景
(一)String
最常規的set/get操作,value可以是String也可以是數字。一般做一些複雜的計數功能的緩存。
(二)hash
這裏value存放的是結構化的對象,比較方便的就是操作其中的某個字段。原博主在做單點登錄的時候,就是用這種數據結構存儲用戶信息,以cookieId作爲key,設置30分鐘爲緩存過期時間,能很好的模擬出類似session的效果。
(三)list
使用List的數據結構,可以做簡單的消息隊列的功能。另外還有一個就是,可以利用lrange命令,做基於redis的分頁功能,性能極佳,用戶體驗好。
(四)set
因爲set堆放的是一堆不重複值的集合。所以可以做全局去重的功能。爲什麼不用JVM自帶的Set進行去重?因爲我們的系統一般都是集羣部署,使用JVM自帶的Set,比較麻煩,爲了一個做一個全局去重,起一個公共服務,太麻煩了。
另外,就是利用交集、並集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能。
(五)sorted set
sorted set多了一個權重參數score,集合中的元素能夠按score進行排列。可以做排行榜應用,取TOP N操作。sorted set可以用來做延時任務。最後一個應用就是可以做範圍查找。

4. redis的過期策略以及內存淘汰機制
分析:比如你redis只能存5G數據,可是你寫了10G,那會刪5G的數據。怎麼刪的?還有,數據已經設置了過期時間,但是時間到了,內存佔用率還是比較高,原因?
回答:
redis採用的是定期刪除+惰性刪除策略
爲什麼不用定時刪除策略?
定時刪除,用一個定時器來負責監視key,過期則自動刪除。雖然內存及時釋放,但是十分消耗CPU資源。在大併發請求下,CPU要將時間應用在處理請求,而不是刪除key,因此沒有采用這一策略.
定期刪除+惰性刪除是如何工作的呢?
定期刪除,redis默認每個100ms檢查,是否有過期的key,有過期key則刪除。需要說明的是,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死)。因此,如果只採用定期刪除策略,會導致很多key到時間沒有刪除。
於是,惰性刪除派上用場。也就是說在你獲取某個key的時候,redis會檢查一下,這個key如果設置了過期時間那麼是否過期了?如果過期了此時就會刪除。
採用定期刪除+惰性刪除就沒其他問題了麼?
不是的,如果定期刪除沒刪除key。然後你也沒即時去請求key,也就是說惰性刪除也沒生效。這樣,redis的內存會越來越高。那麼就應該採用內存淘汰機制。
在redis.conf中有一行配置

#maxmemory-policy volatile-lru

該配置就是配內存淘汰策略的
1)noeviction:當內存不足以容納新寫入數據時,新寫入操作會報錯。應該沒人用吧。
2)allkeys-lru:當內存不足以容納新寫入數據時,在鍵空間中,移除最近最少使用的key。推薦使用,目前項目在用這種。
3)allkeys-random:當內存不足以容納新寫入數據時,在鍵空間中,隨機移除某個key。應該也沒人用吧,你不刪最少使用Key,去隨機刪。
4)volatile-lru:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,移除最近最少使用的key。這種情況一般是把redis既當緩存,又做持久化存儲的時候才用。不推薦
5)volatile-random:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,隨機移除某個key。依然不推薦
6)volatile-ttl:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,有更早過期時間的key優先移除。不推薦
ps:如果沒有設置 expire 的key, 不滿足先決條件(prerequisites); 那麼 volatile-lru, volatile-random 和 volatile-ttl 策略的行爲, 和 noeviction(不刪除) 基本上一致。

5. redis和數據庫雙寫一致性問題
分析:一致性問題是分佈式常見問題,還可以再分爲最終一致性和強一致性。數據庫和緩存雙寫,就必然會存在不一致的問題。答這個問題,先明白一個前提。就是如果對數據有強一致性要求,不能放緩存。我們所做的一切,只能保證最終一致性。另外,我們所做的方案其實從根本上來說,只能說降低不一致發生的概率,無法完全避免。因此,有強一致性要求的數據,不能放緩存。
回答:首先,採取正確更新策略,先更新數據庫,再刪緩存。其次,因爲可能存在刪除緩存失敗的問題,提供一個補償措施即可,例如利用消息隊列。

6. 如何應對緩存穿透和緩存雪崩問題
緩存穿透,即黑客故意去請求緩存中不存在的數據,導致所有的請求都懟到數據庫上,從而數據庫連接異常。
解決方案:
(一)利用互斥鎖,緩存失效的時候,先去獲得鎖,得到鎖了,再去請求數據庫。沒得到鎖,則休眠一段時間重試
(二)採用異步更新策略,無論key是否取到值,都直接返回。value值中維護一個緩存失效時間,緩存如果過期,異步起一個線程去讀數據庫,更新緩存。需要做緩存預熱(項目啓動前,先加載緩存)操作。
(三)提供一個能迅速判斷請求是否有效的攔截機制,比如,利用布隆過濾器,內部維護一系列合法有效的key。迅速判斷出,請求所攜帶的Key是否合法有效。如果不合法,則直接返回。

緩存雪崩,即緩存同一時間大面積的失效,這個時候又來了一波請求,結果請求都懟到數據庫上,從而導致數據庫連接異常。
解決方案:
(一)給緩存的失效時間,加上一個隨機值,避免集體失效。
(二)使用互斥鎖,但是該方案吞吐量明顯下降了。
(三)雙緩存。我們有兩個緩存,緩存A和緩存B。緩存A的失效時間爲20分鐘,緩存B不設失效時間。自己做緩存預熱操作。然後細分以下幾個小點

  1. 從緩存A讀數據庫,有則直接返回
  2. A沒有數據,直接從B讀數據,直接返回,並且異步啓動一個更新線程
  3. 更新線程同時更新緩存A和緩存B

7. 如何解決redis的併發競爭key問題
分析:這個問題大致就是,同時有多個子系統去set一個key。這個時候要注意什麼呢?需要說明一下,原博主百度了一下,發現答案基本都是推薦用redis事務機制。原博主不推薦使用redis的事務機制。因爲生產環境,基本都是redis集羣環境,做了數據分片操作。你一個事務中有涉及到多個key操作的時候,這多個key不一定都存儲在同一個redis-server上。因此,redis的事務機制,十分雞肋。
答案:
(1)如果對這個key操作,不要求順序
這種情況下,準備一個分佈式鎖,大家去搶鎖,搶到鎖就做set操作即可,比較簡單。
(2)如果對這個key操作,要求順序
假設有一個key1,系統A需要將key1設置爲valueA,系統B需要將key1設置爲valueB,系統C需要將key1設置爲valueC.
期望按照key1的value值按照 valueA–>valueB–>valueC的順序變化。這種時候我們在數據寫入數據庫的時候,需要保存一個時間戳。假設時間戳如下:
系統A key 1 {valueA 3:00}
系統B key 1 {valueB 3:05}
系統C key 1 {valueC 3:10}

那麼,假設這會系統B先搶到鎖,將key1設置爲{valueB 3:05}。接下來系統A搶到鎖,發現自己的valueA的時間戳早於緩存中的時間戳,那就不做set操作了。以此類推。
其他方法,比如利用隊列,將set方法變成串行訪問也可以。總之,靈活變通。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章