Redis 6.0 新特性

Redis 6.0 來了

Redis 6.0.0 穩定版(GA)終於發佈,這個版本提供了諸多令人心動的新特性及功能改進,比如新網絡協議RESP3,新的集羣代理,ACL等,其中關注度最高的應該是“多線程”了,帶着衆多疑問,我們來一起開始“Redis 6.0 新特性”。

1. Redis6.0之前的版本真的是單線程嗎?

Redis在處理客戶端的請求時,包括獲取 (socket 讀)、解析、執行、內容返回 (socket 寫) 等都由一個順序串行的主線程處理,這就是所謂的“單線程”。但如果嚴格來講從Redis4.0之後並不是單線程,除了主線程外,它也有後臺線程在處理一些較爲緩慢的操作,例如清理髒數據、無用連接的釋放、大 key 的刪除等等。

2. Redis6.0之前爲什麼一直不使用多線程?

官方曾做過類似問題的回覆:使用Redis時,幾乎不存在CPU成爲瓶頸的情況, Redis主要受限於內存和網絡。例如在一個普通的Linux系統上,Redis通過使用pipelining每秒可以處理100萬個請求,所以如果應用程序主要使用O(N)或O(log(N))的命令,它幾乎不會佔用太多CPU。

使用了單線程後,可維護性高。多線程模型雖然在某些方面表現優異,但是它卻引入了程序執行順序的不確定性,帶來了併發讀寫的一系列問題,增加了系統複雜度、同時可能存在線程切換、甚至加鎖解鎖、死鎖造成的性能損耗。Redis通過AE事件模型以及IO多路複用等技術,處理性能非常高,因此沒有必要使用多線程。單線程機制使得 Redis 內部實現的複雜度大大降低,Hash 的惰性 Rehash、Lpush 等等 “線程不安全” 的命令都可以無鎖進行。

3.Redis6.0爲什麼要引入多線程呢?

Redis將所有數據放在內存中,內存的響應時長大約爲100納秒,對於小數據包,Redis服務器可以處理80,000到100,000 QPS,這也是Redis處理的極限了,對於80%的公司來說,單線程的Redis已經足夠使用了。

但隨着越來越複雜的業務場景,有些公司動不動就上億的交易量,因此需要更大的QPS。常見的解決方案是在分佈式架構中對數據進行分區並採用多個服務器,但該方案有非常大的缺點,例如要管理的Redis服務器太多,維護代價大;某些適用於單個Redis服務器的命令不適用於數據分區;數據分區無法解決熱點讀/寫問題;數據偏斜,重新分配和放大/縮小變得更加複雜等等。

從Redis自身角度來說,因爲讀寫網絡的read/write系統調用佔用了Redis執行期間大部分CPU時間,瓶頸主要在於網絡的 IO 消耗, 優化主要有兩個方向:

• 提高網絡 IO 性能,典型的實現比如使用 DPDK 來替代內核網絡棧的方式
• 使用多線程充分利用多核,典型的實現比如 Memcached。

協議棧優化的這種方式跟 Redis 關係不大,支持多線程是一種最有效最便捷的操作方式。所以總結起來,redis支持多線程主要就是兩個原因:

• 可以充分利用服務器 CPU 資源,目前主線程只能利用一個核
• 多線程任務可以分攤 Redis 同步 IO 讀寫負荷

4.Redis6.0默認是否開啓了多線程?

Redis6.0的多線程默認是禁用的,只使用主線程。如需開啓需要修改redis.conf配置文件:io-threads-do-reads yes
在這裏插入圖片描述

5.Redis6.0多線程開啓時,線程數如何設置?

開啓多線程後,還需要設置線程數,否則是不生效的。同樣修改redis.conf配置文件
在這裏插入圖片描述
關於線程數的設置,官方有一個建議:4核的機器建議設置爲2或3個線程,8核的建議設置爲6個線程,線程數一定要小於機器核數。還需要注意的是,線程數並不是越大越好,官方認爲超過了8個基本就沒什麼意義了。

6.Redis6.0採用多線程後,性能的提升效果如何?

Redis 作者 antirez 在 RedisConf 2019分享時曾提到:Redis 6 引入的多線程 IO 特性對性能提升至少是一倍以上。國內也有大牛曾使用unstable版本在阿里雲esc進行過測試,GET/SET 命令在4線程 IO時性能相比單線程是幾乎是翻倍了。

測試環境

Redis Server: 阿里雲 Ubuntu 18.04,8 CPU 2.5 GHZ, 8G 內存,主機型號 ecs.ic5.2xlarge
Redis Benchmark Client: 阿里雲 Ubuntu 18.04,8 2.5 GHZ CPU, 8G 內存,主機型號 ecs.ic5.2xlarge

測試結果
在這裏插入圖片描述

詳見:https://zhuanlan.zhihu.com/p/76788470

說明1:這些性能驗證的測試並沒有針對嚴謹的延時控制和不同併發的場景進行壓測。數據僅供驗證參考而不能作爲線上指標。

說明2:如果開啓多線程,至少要4核的機器,且Redis實例已經佔用相當大的CPU耗時的時候才建議採用,否則使用多線程沒有意義。所以估計80%的公司開發人員看看就好。

7.Redis6.0多線程的實現機制?

在這裏插入圖片描述

流程簡述如下

1、主線程負責接收建立連接請求,獲取 socket 放入全局等待讀處理隊列
2、主線程處理完讀事件之後,通過 RR(Round Robin) 將這些連接分配給這些 IO 線程
3、主線程阻塞等待 IO 線程讀取 socket 完畢
4、主線程通過單線程的方式執行請求命令,請求數據讀取並解析完成,但並不執行
5、主線程阻塞等待 IO 線程將數據回寫 socket 完畢
6、解除綁定,清空等待隊列
在這裏插入圖片描述
(圖片來源:https://ruby-china.org/topics/38957)

該設計有如下特點:
1、IO 線程要麼同時在讀 socket,要麼同時在寫,不會同時讀或寫
2、IO 線程只負責讀寫 socket 解析命令,不負責命令處理

8.開啓多線程後,是否會存在線程併發安全問題?

從上面的實現機制可以看出,Redis的多線程部分只是用來處理網絡數據的讀寫和協議解析,執行命令仍然是單線程順序執行。所以我們不需要去考慮控制 key、lua、事務,LPUSH/LPOP 等等的併發及線程安全問題。

9.Linux環境上如何安裝Redis6.0.1(6.0的正式版是6.0.1)?

這個和安裝其他版本的redis沒有任何區別,整個流程跑下來也沒有任何的坑,所以這裏就不做描述了。唯一要注意的就是配置多線程數一定要小於cpu的核心數,查看核心數量命令:

[[email protected] ~]# lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 4
On-line CPU(s) list: 0-3

10.Redis6.0的多線程和Memcached多線程模型進行對比

前些年memcached 是各大互聯網公司常用的緩存方案,因此redis 和 memcached 的區別基本成了面試官緩存方面必問的面試題,最近幾年memcached用的少了,基本都是 redis。不過隨着Redis6.0加入了多線程特性,類似的問題可能還會出現,接下來我們只針對多線程模型來簡單比較一下。

在這裏插入圖片描述

如上圖所示:Memcached 服務器採用 master-woker 模式進行工作,服務端採用 socket 與客戶端通訊。主線程、工作線程 採用 pipe管道進行通訊。主線程採用 libevent 監聽 listen、accept 的讀事件,事件響應後將連接信息的數據結構封裝起來,根據算法選擇合適的工作線程,將連接任務攜帶連接信息分發出去,相應的線程利用連接描述符建立與客戶端的socket連接 並進行後續的存取數據操作。

Redis6.0與Memcached多線程模型對比:
相同點:都採用了 master線程-worker 線程的模型
不同點:Memcached 執行主邏輯也是在 worker 線程裏,模型更加簡單,實現了真正的線程隔離,符合我們對線程隔離的常規理解。而 Redis 把處理邏輯交還給 master 線程,雖然一定程度上增加了模型複雜度,但也解決了線程併發安全等問題。

11.Redis作者是如何點評 “多線程”這個新特性的?

關於多線程這個特性,在6.0 RC1時,Antirez曾做過說明:

Redis支持多線程有2種可行的方式:第一種就是像“memcached”那樣,一個Redis實例開啓多個線程,從而提升GET/SET等簡單命令中每秒可以執行的操作。這涉及到I/O、命令解析等多線程處理,因此,我們將其稱之爲“I/O threading”。另一種就是允許在不同的線程中執行較耗時較慢的命令,以確保其它客戶端不被阻塞,我們將這種線程模型稱爲“Slow commands threading”。

經過深思熟慮,Redis不會採用“I/O threading”,redis在運行時主要受制於網絡和內存,所以提升redis性能主要是通過在多個redis實例,特別是redis集羣。接下來我們主要會考慮改進兩個方面:
1.Redis集羣的多個實例通過編排能夠合理地使用本地實例的磁盤,避免同時重寫AOF。
2.提供一個Redis集羣代理,便於用戶在沒有較好的集羣協議客戶端時抽象出一個集羣。

補充說明一下,Redis和memcached一樣是一個內存系統,但不同於Memcached。多線程是複雜的,必須考慮使用簡單的數據模型,執行LPUSH的線程需要服務其他執行LPOP的線程。

我真正期望的實際是“slow operations threading”,在redis6或redis7中,將提供“key-level locking”,使得線程可以完全獲得對鍵的控制以處理緩慢的操作。

詳見:http://antirez.com/news/126

12.Redis線程中經常提到IO多路複用,如何理解?

這是IO模型的一種,即經典的Reactor設計模式,有時也稱爲異步阻塞IO。
在這裏插入圖片描述

多路指的是多個socket連接,複用指的是複用一個線程。多路複用主要有三種技術:select,poll,epoll。epoll是最新的也是目前最好的多路複用技術。採用多路 I/O 複用技術可以讓單個線程高效的處理多個連接請求(儘量減少網絡IO的時間消耗),且Redis在內存中操作數據的速度非常快(內存內的操作不會成爲這裏的性能瓶頸),主要以上兩點造就了Redis具有很高的吞吐量。

13.你知道Redis的彩蛋LOLWUT嗎?

這個其實從Redis5.0就開始有了,但是原諒我剛剛知道。作者是這麼描述這個功能的《LOLWUT: a piece of art inside a database command》,“數據庫命令中的一件藝術品”。你可以把它稱之爲情懷,也可以稱之爲彩蛋,具體是什麼,我就不透露了。和我一樣不清楚是什麼的小夥伴可以參見:http://antirez.com/news/123,每次運行都會隨機生成的噢。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章