Redis单线程原理

Redis单线程原理

Redis是单进程单线程的,Redis利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销。

单线程指的是网络请求模块使用了一个线程(所以不需考虑并发安全性),即一个线程处理所有网络请求,其他模块仍用了多个线程。

Redis客户端对服务端的每次调用都经历了发送命令,执行命令,返回结果三个过程。其中执行命令阶段,由于Redis是单线程来处理命令的,所有到达服务端的命令都不会立刻执行,所有的命令都会进入一个队列中,然后逐个执行,并且多个客户端发送的命令的执行顺序是不确定的,但是可以确定的是不会有两条命令被同时执行,不会产生并发问题,这就是Redis的单线程基本模型。

Redis服务器通过socket(套接字)与客户端或其他Redis服务器进行连接,而文件事件就是服务器对socket操作的抽象。服务器与客户端或其他服务器的通信会产生相应的文件事件,而服务器通过监听并处理这些事件来完成一系列网络通信操作。

Redis基于Reactor模式开发了自己的网络事件处理器——文件事件处理器,文件事件处理器使用I/O多路复用程序来同时监听多个socket(I/O多路复用技术下面有介绍),并根据socket目前执行的任务来为socket关联不同的事件处理器。当被监听的socket准备好执行连接应答、读取、写入、关闭等操作时,与操作相对应的文件事件就会产生,这时文件事件处理器就会调用socket之前已关联好的事件处理器来处理这些事件。

文件事件处理器的构成:
在这里插入图片描述
注意:其中I/O多路复用程序通过队列向文件事件分派器传送socket

Redis是单线程的原因

1.官网
由于Redis是基于内存的操作,因此CPU并不是Redis的瓶颈。 Redis的瓶颈很可能是机器内存或网络带宽的大小。 既然单线程易于实现并且CPU不会成为瓶颈,那采用单线程解决方案是合乎逻辑的了。

2.性能指标
关于redis的性能,官方网站也有介绍,普通笔记本可以轻松地每秒处理数十万个请求。

3.详细原因
1)不需要各种锁的性能消耗
Redis的数据结构并非全都是简单的键值(Key-Value),而是有复杂的结构,如列表(list)和哈希(hash)。 这些结构可以执行细粒度的操作,例如在长列表后面添加元素并将其添加到哈希(hash)或删除对象。

这些操作可能需要非常大量的锁,从而导致同步开销显着增加。 简而言之,在单线程的情况下,不需要考虑各种锁,没有锁释放操作,也没有由于可能的死锁而导致的性能消耗。

2)单线程多进程集群方案
单线程的功能实际上非常强大,每个内核的效率也很高。 与单线程相比,多线程自然可以具有更高的性能限制。 但是,在当今的计算环境中,甚至单机多线程限制通常也无法满足。需要进一步探索的是多服务器群集方案,并且这些方案中的多线程技术仍然是不可用的。

所以单线程、多进程的集群不失为一个时髦的解决方案。

3)CPU消耗
单线程用于避免不必要的上下文切换和竞争条件,并且不存在消耗CPU的多进程或多线程切换。 但是,如果CPU成为Redis的瓶颈,或者不想让服务器的其他CPU内核闲置怎么办? 您可以考虑几个Redis进程。 Redis是一个键值(key-value)数据库,而不是关系数据库,并且数据之间没有约束。 只要客户端能够区分哪个键位于哪个Redis进程上,就可以完成了。

Redis单线程的优劣势

单进程单线程优势
代码更清晰,处理逻辑也更简单。 无需考虑各种锁。 没有锁定释放操作。 由于可能存在死锁,因此不会降低性能。 没有由多进程或多线程消耗的CPU引起的切换

单进程单线程弊端
无法利用多核CPU的性能,但可以通过在单台计算机上打开多个Redis实例来提高性能;

IO多路复用技术
当有多个连接时,Redis使用网络IO多路复用技术来确保系统的高吞吐量。 多路复用是指多个socket连接,而多路复用是指对线程进行多路复用。

多路复用主要有三种技术:select,poll,epoll。epoll是目前最新的也是最好的多路复用技术了。

“多路复用”是指多个网络连接,“多路复用”是指多路复用同一线程。 使用多个I / O多路复用技术可以使单个线程有效地处理多个连接请求(最大程度地减少网络IO的时间消耗),并且Redis可以非常快速地操作内存中的数据(这里的内存操作不会成为性能瓶颈),以上两个 要点使Redis具有很高的吞吐量。
在这里插入图片描述
关于I/O多路复用(又被称为“事件驱动”),首先要理解的是,操作系统为你提供了一个功能,当你的某个socket可读或者可写的时候,它可以给你一个通知。这样当配合非阻塞的socket使用时,只有当系统通知我哪个描述符可读了,我才去执行read操作,可以保证每次read都能读到有效数据而不做纯返回-1和EAGAIN的无用功,写操作类似。

操作系统的这个功能是通过select/poll/epoll/kqueue之类的系统调用函数来实现,这些函数都可以同时监视多个描述符的读写就绪状况,这样,多个描述符的I/O操作都能在一个线程内并发交替地顺序完成,这就叫I/O多路复用,这里的“多路”指的是多个网络连接,“复用”指的是复用同一个Redis处理线程。

采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络 I/O 的时间消耗),且 Redis 在内存中操作数据的速度非常快,也就是说内存内的操作不会成为影响Redis性能的瓶颈,所有 Redis 具有很高的吞吐量。

Redis的单线程为什么这么快?

1.完全基于内存,绝大部分请求是纯粹的内存操作,非常快速。数据存在内存中,类似于HashMap,HashMap的优势就是查找和操作的时间复杂度都是O(1);

2.数据结构简单,对数据操作也简单,Redis中的数据结构是专门进行设计的;

3.采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗;

4.使用多路I/O复用模型,非阻塞I/O;

5.Redis直接自己构建了VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求;

为什么不采用多进程或多线程处理?

1.多线程处理可能涉及到锁

2.多线程处理会涉及到线程切换而消耗CPU

单线程处理的缺点?

1.耗时的命令会导致并发的下降,不只是读并发,写并发也会下降

2.无法发挥多核CPU性能,不过可以通过在单机开多个Redis实例来完善

4、Redis不存在线程安全问题?

Redis采用了线程封闭的方式,把任务封闭在一个线程,自然避免了线程安全问题,不过对于需要依赖多个redis操作(即:多个Redis操作命令)的复合操作来说,依然需要锁,而且有可能是分布式锁。

参考文章:
Redis为什么是单线程,高并发快由哪些因素决定?
干货|Redis单线程的正确理解

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章