面試官:你確定 Redis 是單線程的進程嗎?

作者:小林coding

計算機八股文網站:https://xiaolincoding.com

大家好,我是小林。

這次主要分享 Redis 線程模型篇的面試題。

  • Redis 是單線程嗎?
  • Redis 單線程模式是怎樣的?
  • Redis 採用單線程爲什麼還這麼快?
  • Redis 6.0 之前爲什麼使用單線程?
  • Redis 6.0 之後爲什麼引入了多線程?

Redis 是單線程嗎?

Redis 單線程指的是「接收客戶端請求->解析請求 ->進行數據讀寫等操作->發生數據給客戶端」這個過程是由一個線程(主線程)來完成的,這也是我們常說 Redis 是單線程的原因。

但是,Redis 程序並不是單線程的,Redis 在啓動的時候,是會啓動後臺線程(BIO)的:

  • Redis 在 2.6 版本,會啓動 2 個後臺線程,分別處理關閉文件、AOF 刷盤這兩個任務;
  • Redis 在 4.0 版本之後,新增了一個新的後臺線程,用來異步釋放 Redis 內存,也就是 lazyfree 線程。例如執行 unlink key / flushdb async / flushall async 等命令,會把這些刪除操作交給後臺線程來執行,好處是不會導致 Redis 主線程卡頓。因此,當我們要刪除一個大 key 的時候,不要使用 del 命令刪除,因爲 del 是在主線程處理的,這樣會導致 Redis 主線程卡頓,因此我們應該使用 unlink 命令來異步刪除大key。

之所以 Redis 爲「關閉文件、AOF 刷盤、釋放內存」這些任務創建單獨的線程來處理,是因爲這些任務的操作都是很耗時的,如果把這些任務都放在主線程來處理,那麼 Redis 主線程就很容易發生阻塞,這樣就無法處理後續的請求了。

後臺線程相當於一個消費者,生產者把耗時任務丟到任務隊列中,消費者(BIO)不停輪詢這個隊列,拿出任務就去執行對應的方法即可。

關閉文件、AOF 刷盤、釋放內存這三個任務都有各自的任務隊列:

  • BIO_CLOSE_FILE,關閉文件任務隊列:當隊列有任務後,後臺線程會調用 close(fd) ,將文件關閉;
  • BIO_AOF_FSYNC,AOF刷盤任務隊列:當 AOF 日誌配置成 everysec 選項後,主線程會把 AOF 寫日誌操作封裝成一個任務,也放到隊列中。當發現隊列有任務後,後臺線程會調用 fsync(fd),將 AOF 文件刷盤,
  • BIO_LAZY_FREE,lazy free 任務隊列:當隊列有任務後,後臺線程會 free(obj) 釋放對象 / free(dict) 刪除數據庫所有對象 / free(skiplist) 釋放跳錶對象;

Redis 單線程模式是怎樣的?

Redis 6.0 版本之前的單線模式如下圖:

圖中的藍色部分是一個事件循環,是由主線程負責的,可以看到網絡 I/O 和命令處理都是單線程。 Redis 初始化的時候,會做下面這幾年事情:

  • 首先,調用 epoll_create() 創建一個 epoll 對象和調用 socket() 一個服務端 socket
  • 然後,調用 bind() 綁定端口和調用 listen() 監聽該 socket;
  • 然後,將調用 epoll_crt() 將 listen socket 加入到 epoll,同時註冊「連接事件」處理函數。

初始化完後,主線程就進入到一個事件循環函數,主要會做以下事情:

  • 首先,先調用處理髮送隊列函數,看是發送隊列裏是否有任務,如果有發送任務,則通過 write 函數將客戶端發送緩存區裏的數據發送出去,如果這一輪數據沒有發生完,就會註冊寫事件處理函數,等待 epoll_wait 發現可寫後再處理 。
  • 接着,調用 epoll_wait 函數等待事件的到來:
    • 如果是連接事件到來,則會調用連接事件處理函數,該函數會做這些事情:調用 accpet 獲取已連接的 socket -> 調用 epoll_ctr 將已連接的 socket 加入到 epoll -> 註冊「讀事件」處理函數;
    • 如果是讀事件到來,則會調用讀事件處理函數,該函數會做這些事情:調用 read 獲取客戶端發送的數據 -> 解析命令 -> 處理命令 -> 將客戶端對象添加到發送隊列 -> 將執行結果寫到發送緩存區等待發送;
    • 如果是寫事件到來,則會調用寫事件處理函數,該函數會做這些事情:通過 write 函數將客戶端發送緩存區裏的數據發送出去,如果這一輪數據沒有發生完,就會繼續註冊寫事件處理函數,等待 epoll_wait 發現可寫後再處理 。

以上就是 Redis 單線模式的工作方式,如果你想看源碼解析,可以參考這一篇:爲什麼單線程的 Redis 如何做到每秒數萬 QPS ?

Redis 採用單線程爲什麼還這麼快?

官方使用基準測試的結果是,單線程的 Redis 吞吐量可以達到 10W/每秒,如下圖所示:

之所以 Redis 採用單線程(網絡 I/O 和執行命令)那麼快,有如下幾個原因:

  • Redis 的大部分操作都在內存中完成,並且採用了高效的數據結構,因此 Redis 瓶頸可能是機器的內存或者網絡帶寬,而並非 CPU,既然 CPU 不是瓶頸,那麼自然就採用單線程的解決方案了;
  • Redis 採用單線程模型可以避免了多線程之間的競爭,省去了多線程切換帶來的時間和性能上的開銷,而且也不會導致死鎖問題。
  • Redis 採用了 I/O 多路複用機制處理大量的客戶端 Socket 請求,IO 多路複用機制是指一個線程處理多個 IO 流,就是我們經常聽到的 select/epoll 機制。簡單來說,在 Redis 只運行單線程的情況下,該機制允許內核中,同時存在多個監聽 Socket 和已連接 Socket。內核會一直監聽這些 Socket 上的連接請求或數據請求。一旦有請求到達,就會交給 Redis 線程處理,這就實現了一個 Redis 線程處理多個 IO 流的效果。

Redis 6.0 之前爲什麼使用單線程?

我們都知道單線程的程序是無法利用服務器的多核 CPU 的,那麼早期 Redis 版本的主要工作(網絡 I/O 和執行命令)爲什麼還要使用單線程呢?我們不妨先看一下Redis官方給出的FAQ

核心意思是:CPU 並不是制約 Redis 性能表現的瓶頸所在,更多情況下是受到內存大小和網絡I/O的限制,所以 Redis 核心網絡模型使用單線程並沒有什麼問題,如果你想要使用服務的多核CPU,可以在一臺服務器上啓動多個節點或者採用分片集羣的方式。

除了上面的官方回答,選擇單線程的原因也有下面的考慮。

使用了單線程後,可維護性高,多線程模型雖然在某些方面表現優異,但是它卻引入了程序執行順序的不確定性,帶來了併發讀寫的一系列問題,增加了系統複雜度、同時可能存在線程切換、甚至加鎖解鎖、死鎖造成的性能損耗

Redis 6.0 之後爲什麼引入了多線程?

雖然 Redis 的主要工作(網絡 I/O 和執行命令)一直是單線程模型,但是在 Redis 6.0 版本之後,也採用了多個 I/O 線程來處理網絡請求這是因爲隨着網絡硬件的性能提升,Redis 的性能瓶頸有時會出現在網絡 I/O 的處理上

所以爲了提高網絡請求處理的並行度,Redis 6.0 對於網絡請求採用多線程來處理。但是對於讀寫命令,Redis 仍然使用單線程來處理,所以大家不要誤解 Redis 有多線程同時執行命令。

Redis 官方表示,Redis 6.0 版本引入的多線程 I/O 特性對性能提升至少是一倍以上

Redis 6.0 版本支持的 I/O 多線程特性,默認是 I/O 多線程只處理寫操作(write client socket),並不會以多線程的方式處理讀操作(read client socket)。要想開啓多線程處理客戶端讀請求,就需要把 Redis.conf 配置文件中的 io-threads-do-reads 配置項設爲 yes。

//讀請求也使用io多線程
io-threads-do-reads yes 

同時, Redis.conf 配置文件中提供了 IO 多線程個數的配置項。

// io-threads N,表示啓用 N-1 個 I/O 多線程(主線程也算一個 I/O 線程)
io-threads 4 

關於線程數的設置,官方的建議是如果爲 4 核的 CPU,建議線程數設置爲 2 或 3,如果爲 8 核 CPU 建議線程數設置爲 6,線程數一定要小於機器核數,線程數並不是越大越好。 因此, Redis 6.0 版本之後,Redis 在啓動的時候,默認情況下會有 6 個線程:

  • Redis-server : Redis的主線程,主要負責執行命令;
  • bio_close_file、bio_aof_fsync、bio_lazy_free:三個後臺線程,分別異步處理關閉文件任務、AOF刷盤任務、釋放內存任務;
  • io_thd_1、io_thd_2、io_thd_3:三個 I/O 線程,io-threads 默認是 4 ,所以會啓動 3(4-1)個 I/O 多線程,用來分擔 Redis 網絡 I/O 的壓力。

系列《圖解Redis》文章:

面試篇:

數據類型篇:

持久化篇:

功能篇:

高可用篇:

緩存篇:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章