Redis 高級特性 Redis Stream使用

Redis Stream 簡介

Redis Stream 是 Redis 5.0 版本新增加的數據結構。
Stream從字面上看是流類型,但其實從功能上看,應該是Redis對消息隊列(MQ,Message Queue)的完善實現。下文稱Stream爲隊列

Stream 出現原因
Stream的出現是爲了給Redis提供完善的消息隊列功能

基於Reids的消息隊列實現有很多種,例如:

  • PUB/SUB,訂閱/發佈模式
  • 基於List的 LPUSH+BRPOP 的實現
  • 基於有序集合的實現
類型 優點 缺點
List 支持阻塞式的獲取消息 沒有消息多播功能,沒有ACK機制,無法重複消費等等
Pub/Sub 支持消息多播 消息無法持久化,只管發送,如果出現網絡斷開、Redis宕機等,消息就直接沒了,自然也沒有ACK機制。
Sorted Set 支持延時消息 不支持阻塞式獲取消息、不允許重複消費、不支持分組。

發佈訂閱模式

Redis 發佈訂閱 (pub/sub) 是一種消息通信模式:發送者 (pub) 發送消息,訂閱者 (sub) 接收消息。
image

當發佈者向channel中發佈消息時,所有訂閱了channel的客戶端都會收到消息。

訂閱者首先訂閱channel

psubscribe news

image

發佈者發佈消息

publish news "hello world"

image

所有的訂閱者都收到了消息。

致命缺點
Redis的Pub/Sub爲什麼被拋棄?
最主要的原因是它無法持久化,沒有實現持久化機制的Pub/Sub,無法做到消息的不丟失,在客戶端宕機或者Redis服務宕機的情況下,都會導致消息丟失。

Stream

Stream彌補了Redis作爲消息隊列技術選型上的不足之處。
Redis 5.0發佈的Stream相比Pub/Sub模塊,Stream支持消息持久化,結合集羣使其成爲了一個比較可靠的消息隊列。

隊列結構圖:
image

Stream 實現的功能包括如下:

  1. 提供了消息多播的功能,同一個消息可被分發給多個單消費者和消費者組

  2. 提供了消息持久化的功能,可以讓任何消費者訪問任何時刻的歷史消息

  3. 提供了對於消費者和消費者組的阻塞、非阻塞的獲取消息的功能

  4. 提供了強大的消費者組的功能:

  • 消費者組實現同組多個消費者並行但不重複消費消息的能力,提升消費能力;
  • 消費者組能夠記住最新消費的信息,保證消息連續消費;
  • 消費者組提供了ACK確認機制,保證消息被成功消費,不丟失;

Stream本質上是Redis中的key,相關指令根據可以分爲兩類,分別是消息隊列相關指令,消費組相關指令。

消息隊列相關指令:

指令名稱 指令作用
XADD 添加消息到隊列末尾
XTRIM 限制Stream的長度,如果已經超長會進行截取
XDEL 刪除消息
XLEN 獲取Stream中的消息長度
XRANGE 獲取消息列表(可以指定範圍),忽略刪除的消息
XREVRANGE 和XRANGE相比區別在於反向獲取,ID從大到小
XREAD 獲取消息(阻塞/非阻塞),返回大於指定ID的消息

消費者相關指令:

指令名稱 指令作用
XGROUP CREATE 創建消費者組
XREADGROUP 讀取消費者組中的消息
XACK ack消息,消息被標記爲“已處理”
XGROUP SETID 設置消費者組最後遞送消息的ID
XGROUP DELCONSUMER 刪除消費者組
XPENDING 打印待處理消息的詳細信息
XCLAIM 轉移消息的∂歸屬權(長期未被處理/無法處理的消息,轉交給其他消費者組進行處理)
XINFO 打印Stream\Consumer\Group的詳細信息
XINFO GROUPS 打印消費者組的詳細信息
XINFO STREAM 打印Stream的詳細信息

消息隊列操作

XADD

使用XADD命令添加消息到隊列末尾,如果指定的 隊列不存在,則該命令執行時會新建一個隊列。
添加的消息是一個和多個鍵值對。XADD也是唯一可以向隊列中添加數據的 Redis 命令。

語法格式:

XADD key ID field value [field value ...]
  • key:隊列名稱,如果不存在就創建
  • ID:消息id,使用*表示由redis生成。可以自定義,但是要自己保證遞增性
  • field value:記錄,當前消息內容,由一個或多個key-value構成

命令使用:
創建兩條消息,分別是(name=tom, age=22),(height=180, use=iphone)

127.0.0.1:6379> xadd mystream * name tom age 22
"1674984765438-0"
127.0.0.1:6379> xadd mystream * height 180 use iphone
"1674985213802-0"

創建消息時會生成一個序號,支持自定義序號和自動生成序號。*表示自動生成序號

XLEN

使用XLEN獲取隊列包含的元素數量,即消息長度
語法格式:

XLEN key

命令使用:

127.0.0.1:6379> xlen mystream
(integer) 2

XDEL

使用XDEL刪除消息。語法格式:

XDEL key ID [ID ...]

XDEL刪除消息的指令,並不會從內存上刪除消息,它只是給消息打上標記位,下次通過XRANGE指令忽略這些消息

XRANGE

使用XRANGE獲取消息列表,會自動過濾已經刪除的消息,語法格式:

XRANGE key start end [COUNT count]
  • key:隊列名
  • start:開始值,-表示最小值
  • end:結束值,+表示最大值
  • count:數量

命令使用:
不指定count默認查詢所有

127.0.0.1:6379> xrange mystream - + 
1) 1) "1674984765438-0"
   2) 1) "name"
      2) "tom"
      3) "age"
      4) "22"
2) 1) "1674985213802-0"
   2) 1) "height"
      2) "180"
      3) "use"
      4) "iphone"
127.0.0.1:6379> 

XREAD

XREAD命令提供讀取隊列消息的能力,返回大於指定ID的消息。
XREAD常用於用於迭代隊列的消息,所以傳遞給 XREAD 的通常是上一次從該隊列接收到的最後一個消息的ID。

語法格式:

XREAD [COUNT count] [BLOCK milliseconds] STREAMS key [key ...] id [id ...]
  • count:用於限定獲取的消息數量
  • BLOCK milliseconds:用於設置XREAD爲阻塞模式以及阻塞的時長,單位毫秒,默認爲非阻塞模式
  • ID:設置開始讀取的消息ID,使用0表示從第一條消息開始。
    消息隊列ID是單調遞增的,所以通過設置起點,可以向後讀取。
    在阻塞模式中,可以使用$,表示最新的消息ID, block 0表示永久阻塞。(非阻塞模式下$無意義)。

命令使用:

非阻塞讀取
從第一條消息開始

127.0.0.1:6379> xread streams mystream 0
1) 1) "mystream"
   2) 1) 1) "1674984765438-0"
         2) 1) "name"
            2) "tom"
            3) "age"
            4) "22"
      2) 1) "1674985213802-0"
         2) 1) "height"
            2) "180"
            3) "use"
            4) "iphone"
127.0.0.1:6379> 

阻塞讀取

127.0.0.1:6379> xread block 10000 streams mystream $
(nil)
(10.04s)
127.0.0.1:6379>

阻塞模式讀,阻塞時長爲10s。如果10s內未讀取到消息則退出阻塞。另開一個終端向隊列中寫入一條消息,阻塞讀的終端就能接收到消息。
image

消費者操作

XGROUP CREATE

創建消費組。消費組用於管理消費者和隊列讀取記錄。Stream中的消費組有兩個特點:

  1. 從資源結構上說消費者從屬於一個消費組
  2. 一個隊列可以擁有多個消費組。不同消費組之間讀取隊列互不干擾

語法格式:

XGROUP [CREATE key groupname id-or-$] [SETID key groupname id-or-$] [DESTROY key groupname] [DELCONSUMER key groupname consumername]
  • key:隊列名稱,如果不存在就創建
  • groupname:組名
  • id: $表示從尾部開始消費,只接受新消息,當前Stream消息會全部忽略

命令使用:

爲隊列mystream創建一個消費組 mqGroup,從第一個消息開始讀

127.0.0.1:6379> XGROUP CREATE mystream mqGroup 0
OK

XREADGROUP

讀取隊列的消息。在讀取消息時需要指定消費者,只需要指定名字,不用預先創建。

語法格式:

XREADGROUP GROUP group consumer [COUNT count] [BLOCK milliseconds]
  [NOACK] STREAMS key [key ...] id [id ...]
  • group:消費組名
  • consumer:消費者名
  • count:讀取數量
  • BLOCK milliseconds:阻塞讀以及阻塞毫秒數。默認非阻塞。和XREAD類似
  • key:隊列名
  • id:消息ID。ID可以填寫特殊符號>,表示未被組內消費的起始消息

命令使用:
創建消費者consumerA和consumerB,各讀取一條消息

127.0.0.1:6379> XREADGROUP GROUP mqGroup consumerA COUNT 1 STREAMS mystream >
1) 1) "mystream"
   2) 1) 1) "1674984765438-0"
         2) 1) "name"
            2) "tom"
            3) "age"
            4) "22"
            
127.0.0.1:6379> XREADGROUP group mqGroup consumerB count 1 streams mystream >
1) 1) "mystream"
   2) 1) 1) "1674985213802-0"
         2) 1) "height"
            2) "180"
            3) "use"
            4) "iphone"

可以進行組內消費的基本原理是,STREAM類型會爲每個組記錄一個最後讀取的消息ID(last_delivered_id),這樣在組內消費時,就可以從這個值後面開始讀取,保證不重複消費。

消費組消費時,還有一個必須要考慮的問題,就是若某個消費者,消費了某條消息,但是並沒有處理成功時(例如消費者進程宕機),這條消息可能會丟失,因爲組內其他消費者不能再次消費到該消息了

XPENDING

爲了解決組內消息讀取但處理期間消費者崩潰帶來的消息丟失問題,Stream 設計了 Pending 列表,用於記錄讀取但並未確認完畢的消息。
語法格式:

XPENDING key group [[IDLE min-idle-time] start end count [consumer]]
  • key:隊列名
  • group: 消費組名
  • start:開始值,-表示最小值
  • end:結束值,+表示最大值
  • count:數量

命令使用:

首先查看隊列中的消息數量有3個,然後查看已讀取未處理的消息有兩個。

127.0.0.1:6379> xlen mystream
(integer) 3

127.0.0.1:6379> xpending mystream mqGroup
1) (integer) 2 # 2個已讀取但未處理的消息
2) "1674984765438-0" # 起始ID
3) "1674985213802-0" # 結束ID
4) 1) 1) "consumerA"  # 消費者A有1個
      2) "1"
   2) 1) "consumerB"  # 消費者B有1個
      2) "1"

隊列中一共三條信息,有兩條被消費但未處理完畢,也就是上面XREADGROUP消費的兩條。一個是消費者consumerA,另一個是consumerB。

獲取未確認的詳細信息

127.0.0.1:6379> xpending mystream mqGroup - + 10
1) 1) "1674984765438-0"
   2) "consumerA"
   3) (integer) 12110001
   4) (integer) 1
2) 1) "1674985213802-0"
   2) "consumerB"
   3) (integer) 89140701
   4) (integer) 1

XACK

對於已讀取未處理的消息,使用命令 XACK 完成告知消息處理完成
XACK 命令確認消費的信息,一旦信息被確認處理,就表示信息被完善處理。

語法格式:

XACK key group id [id ...]
  • key: stream 名
  • group:消費組
  • id:消息ID

命令使用:

確認消息1674985213802-0

127.0.0.1:6379> XACK mystream mqGroup 1674985213802-0
(integer) 1
127.0.0.1:6379> 

XCLAIM

某個消費者讀取了消息但沒有處理,這時消費者宕機或重啓等就會導致該消息失蹤。那麼就需要該消息轉移給其他的消費者處理,就是消息轉移。XCLAIM來實現消息轉移的操作。

語法格式:

XCLAIM key group consumer min-idle-time id [id ...] [IDLE ms]
  [TIME unix-time-milliseconds] [RETRYCOUNT count] [FORCE] [JUSTID]
  [LASTID id]
  • key: 隊列名稱
  • group :消費組
  • consumer:消費組裏的消費者
  • min-idle-time 最小時間。空閒時間大於min-idle-time的消息纔會被轉移成功
  • id:消息的ID

轉移除了要指定ID外,還需要指定min-idle-time,min-idle-time是最小空閒時間,該值要小於消息的空閒時間,這個參數是爲了保證是多於多長時間的消息未處理的才被轉移。比如超過24小時的處於pending未xack的消息要進行轉移
同時min-idle-time還有一個功能是能夠避免兩個消費者同時轉移一條消息。被轉移的消息的IDLE會被重置爲0。假設兩個消費者都以2min來轉移,第一個成功之後IDLE被重置爲0,第二個消費者就會因爲min-idle-time大與空閒時間而是失敗。

命令使用:
目前未確認的消息

127.0.0.1:6379> xpending mystream mqGroup - + 10
1) 1) "1674984765438-0"
   2) "consumerA"
   3) (integer) 12145595
   4) (integer) 1

id: 1674984765438-0
空閒時間:12145595,單位ms
讀取次數:1

將cosumerA未處理的消息轉移給consumerB。

127.0.0.1:6379> XCLAIM mystream mqGroup consumerB 3600000 1674984765438-0
1) 1) "1674984765438-0"
   2) 1) "name"
      2) "tom"
      3) "age"
      4) "22"

查看未確認的消息
消息已經從consumerA轉移給consumerB,IDLE重置,讀取次數加1。轉移之後就可以繼續處理這條消息。

127.0.0.1:6379> xpending mystream mqGroup - + 10
1) 1) "1674984765438-0"
   2) "consumerB"
   3) (integer) 5729 # 注意IDLE,被重置了
   4) (integer) 2 # 注意,讀取次數也累加了1次

通常轉移操作的完整流程是:

  1. 先用xpending命令找出所有未確認的消息
  2. 再用xclaim命令轉移所有未確認消息

在redis6.2.0之後有一個命令XAUTOCLAIM,可以將xpending查找未確認消息和xclaim轉移消息合併成一個操作。

XINFO

Stream提供了XINFO來實現對服務器信息的監控

查看隊列信息

127.0.0.1:6379> xinfo stream mystream
 1) "length"
 2) (integer) 3
 3) "radix-tree-keys"
 4) (integer) 1
 5) "radix-tree-nodes"
 6) (integer) 2
 7) "groups"
 8) (integer) 1
 9) "last-generated-id"
10) "1674985995856-0"
11) "first-entry"
12) 1) "1674984765438-0"
    2) 1) "name"
       2) "tom"
       3) "age"
       4) "22"
13) "last-entry"
14) 1) "1674985995856-0"
    2) 1) "name"
       2) "jack"

消費組信息

127.0.0.1:6379> xinfo groups mystream
1) 1) "name"
   2) "mqGroup"
   3) "consumers"
   4) (integer) 2
   5) "pending"
   6) (integer) 1
   7) "last-delivered-id"
   8) "1674985213802-0"

消費者組成員信息

127.0.0.1:6379> xinfo consumers mystream mqGroup
1) 1) "name"
   2) "consumerA"
   3) "pending"
   4) (integer) 0
   5) "idle"
   6) (integer) 12904777
2) 1) "name"
   2) "consumerB"
   3) "pending"
   4) (integer) 1
   5) "idle"
   6) (integer) 696457
127.0.0.1:6379> 

項目中中Stream的使用

項目中部分web請求的處理是異步處理,web服務調用底層模塊異步執行。當底層模塊處理完成後需要保存結果並通知web服務,所以使用Stream作爲保存的載體。
image

Stream 的生產和消費

生產
向隊列中寫消息

def batch_xadd(self, name: str, payloads: List[Dict]) -> None:
    pipe = self._redis.pipeline()
    for payload in payloads:
        pipe.xadd(name, payload)
    pipe.execute()

消費
定時任務間隔10s從隊列中讀消息

while True:
    
    _, payloads = await self._conn.xautoclaim(
        self.stream_name, self.group_name, self.consumer_name, min_idle_time
    )
    
    id_ = last_id if check_backlog else ">"
    for _, messages in await self._conn.xreadgroup(
        groupname=self.group_name,
        consumername=self.consumer_name,
        streams={self.stream_name: id_},
        block=block_timeout,
    ):
        ...
        last_id = messages[-1][0]
        payloads += messages
    
    # 處理隊列中取出的消息,耗時操作
    successful_ids = await f_processor(payloads)
    if successful_ids:
        await self._conn.xack(self.stream_name, self.group_name, *successful_ids)

Stream和專業消息隊列對比

專業的消息隊列包括:

  1. RabbitMQ
  2. RocketMQ
  3. Kafka

一個專業的消息隊列,必須要滿足兩個條件:

  1. 消息不丟
  2. 消息可堆積

下面從這兩個方面來對比Stream和專業消息隊列。

消息不丟

消息隊列的使用模型如下:
image

要保證消息不丟,就需要在生產者、中間件、消費者這三個方面來分析。

生產者:消息發送失敗或發送超時,這兩種情況會導致數據丟失,可以使用重試來解決。不依賴消息中間件,需要業務實現。

消費者:消費者存在讀取消息未處理完就異常宕機了,消費者要還能重新讀取消息。Stream和其他消息中間件都能做到。

隊列中間件:中間件要保證數據不丟失。 Redis 在以下 2 個場景下,都會導致數據丟失:

  1. AOF 持久化配置爲每秒寫盤,Redis 宕機時會存在丟失最後1秒數據的可能
  2. 主從複製的集羣,主從切換時,從庫還未同步完成主庫發來的數據,就被提成主庫,也存在丟失數據的可能。

基於以上原因可以推斷出,Redis 本身的無法保證嚴格的數據完整性。

專業隊列如何解決數據丟失問題:
RabbitMQ 或 Kafka 這類專業的隊列中間件,在使用時一般是部署一個集羣。生產者在發佈消息時,隊列中間件通常會寫「多個節點」,以此保證消息冗餘。這樣一來,即便其中一個節點掛了,集羣也能的數據不丟失。

消息積壓

因爲 Redis 的數據都存儲在內存中,這就意味着一旦發生消息積壓,則會導致 Redis 的內存持續增長,如果超過機器內存上限,就會面臨 OOM 的風險。

所以,Redis 的 Stream 提供了可以指定隊列最大長度的功能,就是爲了避免這種情況發生。

但 Kafka、RabbitMQ 這類消息隊列就不一樣了,它們的數據都會存儲在磁盤上,磁盤的成本要比內存小得多,當消息積壓時,無非就是多佔用一些磁盤空間,磁盤相比於內存在面對積壓時能輕鬆應對。

總結

綜上可以看到,把 Redis 當作隊列來使用時,始終面臨兩個問題:

  1. Redis 本身可能會丟數據
  2. 面對消息積壓,Redis 內存資源緊張

優缺點

優點

  1. 使用成本低。幾乎每一個項目都會使用Redis,用Stream做消息隊列就不需要額外再引入中間件,減少系統複雜性,運維成本,硬件資源。

缺點

  1. Redis 的數據都存儲在內存中,內存持續增長超過機器內存上限,就會面臨 OOM 的風險
  2. Stream 作爲Redis的一種數據結構,Redis 在持久化或主從切換時有丟失數據的風險,所以Stream也有丟失消息的風險
  3. 所有的消息會一直保存在Stream中,沒有刪除機制。要麼定時清除,那麼設置隊列的長度自動丟棄先入列消息

使用場景

適用
適用業務場景:

  • 場景足夠簡單
  • 對於數據丟失不敏感
  • 消息積壓概率比較小

滿足以上場景把 Redis 當作隊列是完全可以的。
基於redis的高性能和使用內存的機制使得其的性能優於大部分消息隊列。在小規模場景會有更出色的表現。

不適用
不適用業務場景:

  • 對於數據丟失非常敏感,如訂單系統
  • 寫入量非常大,併發請求大
  • 消息積壓時會佔用很多的內存資源,消息數據量大

這些業務場景下建議使用專業的消息隊列中間件。

題外話
技術選型出了技術本身之外還要考慮公司團隊能否匹配技術。

Kafka、RabbitMQ 是非常專業的消息中間件,但它們的部署和運維,相比於 Redis 來說,也會更復雜一些。

如果在一個大公司,公司本身就有優秀的運維團隊,那麼使用這些中間件肯定沒問題,因爲有足夠優秀的人能 hold 住這些中間件,公司也會投入人力和時間在這個方向上。

但是在一個初創公司,業務正處在快速發展期,暫時沒有能 hold 住這些中間件的團隊和人,如果貿然使用這些組件,當發生故障時,排查問題也會變得很困難,甚至會阻礙業務的發展。

實際案例討論

同一個大型項目中子項目的互相調用。TMS調用ATS獲取數據集
image

改用Stream完成
image

理由:

  • 丟失數據不敏感
  • 業務場景簡單
  • 消息積壓概率比較小

參考:
https://zhuanlan.zhihu.com/p/60501638
https://redis.io/commands/xclaim/
https://liziba.blog.csdn.net/article/details/120320018
https://juejin.cn/post/6962423461071290375#heading-2

準備連載一系列關於python異步編程的文章。包括同異步框架性能對比、異步事情驅動原理等。首發微信公衆號,歡迎關注第一時間閱讀。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章