Redis 新特性篇:多線程模型解讀

Redis 官方在 2020 年 5 月正式推出 6.0 版本,提供很多振奮人心的新特性,所以備受關注。

碼老溼,提供了啥特性呀?知道了我能加薪麼?

主要特性如下:

  1. 多線程處理網絡 IO;
  2. 客戶端緩存;
  3. 細粒度權限控制(ACL);
  4. RESP3 協議的使用;
  5. 用於複製的 RDB 文件不在有用,將立刻被刪除;
  6. RDB 文件加載速度更快;

其中備受關注的就是「多線程模型 + 客戶端緩存」,我們只有掌握了新特性原理,才能判斷什麼時候使用 6.0 版本,如何用的更好更快,不踩坑。

本篇先從 Redis 多線程模型開始

碼老溼,Redis 6.0 之前爲什麼不使用多線程?
官方答覆:
  • 使用 Redis 時,幾乎不存在 CPU 成爲瓶頸的情況, Redis 主要受限於內存和網絡。
  • 在一個普通的 Linux 系統上,Redis 通過使用 pipelining 每秒可以處理 100 萬個請求,所以如果應用程序主要使用 O(N) 或O(log(N)) 的命令,它幾乎不會佔用太多 CPU。
  • 使用了單線程後,可維護性高。多線程模型雖然在某些方面表現優異,但是它卻引入了程序執行順序的不確定性,帶來了併發讀寫的一系列問題,增加了系統複雜度、同時可能存在線程切換、甚至加鎖解鎖、死鎖造成的性能損耗。
Redis 通過 AE 事件模型以及 IO 多路複用等技術,處理性能非常高,因此沒有必要使用多線程。
單線程機制讓 Redis 內部實現的複雜度大大降低,Hash 的惰性 Rehash、Lpush 等等『線程不安全』的命令都可以無鎖進行
Redis 6.0 之前單線程指的是 Redis 只有一個線程幹活麼?
非也,Redis 在處理客戶端的請求時,包括獲取 (socket 讀)、解析、執行、內容返回 (socket 寫) 等都由一個順序串行的主線程處理,這就是所謂的「單線程」
其中執行命令階段,由於 Redis 是單線程來處理命令的,所有每一條到達服務端的命令不會立刻執行,所有的命令都會進入一個 Socket 隊列中,當 socket 可讀則交給單線程事件分發器逐個被執行。
此外,有些命令操作可以用後臺線程或子進程執行(比如數據刪除、快照生成、AOF 重寫)。
碼老溼,那 Redis 6.0 爲啥要引入多線程呀?
隨着硬件性能提升,Redis 的性能瓶頸可能出現網絡 IO 的讀寫,也就是:單個線程處理網絡讀寫的速度跟不上底層網絡硬件的速度
讀寫網絡的 read/write 系統調用佔用了Redis 執行期間大部分CPU 時間,瓶頸主要在於網絡的 IO 消耗, 優化主要有兩個方向:
  • 提高網絡 IO 性能,典型的實現比如使用 DPDK 來替代內核網絡棧的方式。
  • 使用多線程充分利用多核,提高網絡請求讀寫的並行度,典型的實現比如 Memcached
添加對用戶態網絡協議棧的支持,需要修改 Redis 源碼中和網絡相關的部分(例如修改所有的網絡收發請求函數),這會帶來很多開發工作量。
而且新增代碼還可能引入新 Bug,導致系統不穩定。
所以,Redis 採用多個 IO 線程來處理網絡請求,提高網絡請求處理的並行度。
需要注意的是,Redis 多 IO 線程模型只用來處理網絡讀寫請求,對於 Redis 的讀寫命令,依然是單線程處理
這是因爲,網絡處理經常是瓶頸,通過多線程並行處理可提高性能。
而繼續使用單線程執行讀寫命令,不需要爲了保證 Lua 腳本、事務、等開發多線程安全機制,實現更簡單。
架構圖如下
圖片來源:後端研究所
主線程與 IO 多線程是如何實現協作呢?
如下圖:
Redis多線程與IO線程
主要流程
  1. 主線程負責接收建立連接請求,獲取 socket 放入全局等待讀處理隊列;
  2. 主線程通過輪詢將可讀 socket 分配給 IO 線程;
  3. 主線程阻塞等待 IO 線程讀取 socket 完成;
  4. 主線程執行 IO 線程讀取和解析出來的 Redis 請求命令;
  5. 主線程阻塞等待 IO 線程將指令執行結果回寫回 socket 完畢;
  6. 主線程清空全局隊列,等待客戶端後續的請求。
思路:將主線程 IO 讀寫任務拆分出來給一組獨立的線程處理,使得多個 socket 讀寫可以並行化,但是 Redis 命令還是主線程串行執行。
如何開啓多線程呢?
Redis 6.0 的多線程默認是禁用的,只使用主線程。如需開啓需要修改 redis.conf 配置文件: io-threads-do-reads yes
碼老溼,線程數是不是越多越好?
當然不是,關於線程數的設置,官方有一個建議:4 核的機器建議設置爲 2 或 3 個線程,8核的建議設置爲 6 個線程,線程數一定要小於機器核數。
線程數並不是越大越好,官方認爲超過了 8 個基本就沒什麼意義了。
另外,開啓多線程後,還需要設置線程數,否則是不生效的

   
   
   
io-threads 4

 

總結與思考

隨着互聯網的飛速發展,互聯網業務系統所要處理的線上流量越來越大,Redis 的單線程模式會導致系統消耗很多 CPU 時間在網絡 I/O 上從而降低吞吐量,要提升 Redis 的性能有兩個方向:
  • 優化網絡 I/O 模塊
  • 提高機器內存讀寫的速度
後者依賴於硬件的發展,暫時無解。所以只能從前者下手,網絡 I/O 的優化又可以分爲兩個方向:
  • 零拷貝技術或者 DPDK 技術
  • 利用多核優勢
模型缺陷
Redis 的多線程網絡模型實際上並不是一個標準的 Multi-Reactors/Master-Workers 模型。
Redis 的多線程方案中,I/O 線程任務僅僅是通過 socket 讀取客戶端請求命令並解析,卻沒有真正去執行命令。
所有客戶端命令最後還需要回到主線程去執行,因此對多核的利用率並不算高,而且每次主線程都必須在分配完任務之後忙輪詢等待所有 I/O 線程完成任務之後才能繼續執行其他邏輯。
在我看來,Redis 目前的多線程方案更像是一個折中的選擇:既保持了原系統的兼容性,又能利用多核提升 I/O 性能。

有道無術,術可成;有術無道,止於術

歡迎大家關注Java之道公衆號


好文章,我在看❤️

本文分享自微信公衆號 - Hollis(hollischuang)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章