InnoDB Buffer Pool详解(缓冲池) 什么是Buffer Pool? Buffer Pool的内存结构 Buffer Pool处理流程 配置 写数据 change buffer

什么是Buffer Pool?

Buffer Pool是MySQL InnoDB引擎用于缓存访问到的表数据的一块内存空间,主要用于加速SQL的执行速度,因为内存的处理速度要远高于访问磁盘。说白了,其实它就相当于我们项目中的Redis缓存,直接访问数据库太慢了,使用Redis做一层缓冲;同理,直接从磁盘获取数据太慢了,使用Buffer Pool做一层缓冲

Buffer Pool的内存结构

我们来看下Buffer Pool的内存结构



可以看出,Buffer Pool由1个大链表组成。为什么用链表来组织数据呢?因为Buffer Pool既然为缓存,肯定有对应的数据淘汰策略,不可能将所有的数据都拿到内存中存储,常见的缓存策略有LRU、LFU等,都是基于链表实现,Buffer Pool采用了基于LRU的自定义淘汰策略,用于解决标准LRU策略中的一些问题。
Buffer Pool链表一分为二为new sublist与old sublist,两个链表首尾相连。默认情况下,old list占用总链表3/8,里面存储的是最近很少访问的数据,即将要淘汰的数据;剩下的为new list,里面存储的是最近才被访问的数据。

Buffer Pool处理流程

我们来看下Buffer Pool是如何利用这两个链表实现内存管理的。

当数据被读取的时候会存入Buffer Pool,这里的读取包含两个操作,一个是用户触发的读取,例如SQL query;或者是InnoDB自动触发的预读读取。

什么是预读?用于异步将磁盘的页InnoDB数据以page为单位存储)读取到buffer pool中,预料这些页会马上被读取到page(数据的,因为InnoDB猜测这些数据可能很快就会被用到。他会带来extent(默认64个page组成一个extent)中的所有page。有两种预读算法:

  • 线性预读【预测在buffer pool中被访问到的数据它临近的页也会很快被访问到,可以使用innodb_read_ahead_threashold配置设置当连续读到多少个page时触发一次预读】
  • 随机预读【根据已经在buffer pool中存在的page来猜测哪些数据将会被读取,如果随机预读开启,InnoDB如果发现Buffer Pool中有13个来自一个extent的page,那么将会发起异步请求读取该extent剩余的page】

被读取的page将会被插入old list的头部,读取old list中的page会使其变“young”,会将其移动到new list的头部。如果page由于用户行为被读取,page第一次被访问的时候就会使其变“young”。这样随着page不断被访问,new list数据越来越多,超过限制后就会存入old list中,若old list也满了之后,就会从old list的尾部进行page的驱逐。
采用old list与new list这样的结构可以有效避免预读的数据不被访问的情况,如果只是原始的LRU算法,那么预读的数据也会被加入到链表的头部,会把真正的热数据往下“挤”,而假设预读的数据又不会被访问,那么Buffer Pool中会存储大量的冷数据,失去了做缓存的作用。

Buffer Pool如何解决大数据量读取的情况?
假设用户执行了一条全表查询的SQL,恰好这个表数据又很大,这就导致Buffer Pool中大量热数据被这个全表查询所替换,而这个数据可能就只会被快速的再访问几次,之后就不再被访问了。
使用innodb_old_blocks_time配置一个时间窗口参数,在第一次访问该页面之后,如果在该窗口时间内访问该page,该page也不会移动到new list的头部了

配置

size必须是innodb_buffer_pool_chunk_size*innodb_buffer_pool_instances的倍数
将buffer pool拆分成多个instance可以提高并发度,每个instance都可以看做一个小的buffer pool,这样可以减少不同线程读写缓存的锁冲突

写数据

Free链表:双向链表,记录那些缓冲页是空闲的
Flush链表:管理Buffer Pool中的脏页,后台线程定时刷脏

change buffer

对于写请求,若修改数据在缓冲池中,直接修改缓冲池数据之后写入磁盘即可。
若修改数据没在缓冲池中,需要先将数据读取到缓冲池,修改数据,写入磁盘,需要读取磁盘数据。


buffer pool的一部分,当我们修改了不在buffer pool中的二级非唯一索引数据(若是唯一索引,innodb必须读取磁盘做唯一性检查),会将修改的内容先缓存到change buffer中,等未来数据被读取时,再将数据合并(merge)恢复到缓冲池中的技术,change buffer主要用于缓存insert ,update, delete语句的结果。写缓冲的目的是降低写操作的磁盘IO,提升数据库性能。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章