此文为极客时间:MySQL实战45讲的12节的学习笔记
一、mysql 的刷盘机制
而之前提到过,mysql 使用了 WAL 技术,即更新的时候先更新内存中的数据,然后必要的时候再将内存中的数据刷入磁盘。我们把内存中这些被修改过,跟磁盘中的数据页不一致的数据页称为脏页。
其中,有四种情况会触发脏页的刷盘:
- redo log 可写空间满了。
- 内存满了,需要淘汰的数据页恰好是脏页。
- 系统不繁忙的时候。
- 关闭数据库的时候。
其中,第三种情况不会为系统带来过多影响的,第四中情况下不会在乎为系统带来的影响。所以我们只需要关注第一和第二种情况:
对于第二种情况,由于 mysql 的更新需要先写日志,所以当日志满了的情况下,所有的更新都会停止,一直到刷完盘日志腾出了空间为止;
而对于第二种情况,当查询的数据在内存中的数据页没有的时候,就需要淘汰旧页释放内存以读入新页,所以当一次查询导致需要淘汰的脏页过多的时候,就需要先等待较长的刷盘时间,然后才能获取响应。
为了避免上述两种情况,必须要控制脏页在内存中的比例。
二、刷脏页的控制策略
首先,我们必须要知道主机磁盘的写入能力有多强,这样 innodb 才可以知道它刷脏页的速度最快应该是多快。
我们可以通过设置 innodb_io_capacity
这个参数来告诉 innodb 磁盘的写入速度。这个参数的值不宜过小,因为这会导致 innodb 错误的估计刷盘速度,最后导致刷脏页的速度跟不上脏页生成的速度。
innodb_io_capacity
规定了刷脏页速度的极限,但是实际上磁盘不可能只服务这么一个功能,所以还需要参考 redo log 的刷盘速度和允许的内存中的脏页比例。
参数 innodb_max_dirty_pages_pct
是脏页比例上限,默认值是 75%。innodb 会根据当前的脏页比例(假设为 M),算出一个范围在 0 到 100 之间的数字,这个公式是 F1(M)
。
而每次写入 redo log 的写入点 wp 都会有一个序号,innodb 会根据这个序号和上一次清理日志的界限 cp 之间的差值——我们假设为 N——计算得到一个范围在 0 到 100 之间的数字,这个公式是 F2(N)
根据上述算得的 F1(M)
和 F2(N)
两个值,取其中较大的值记为 R,之后引擎就可以按照 innodb_io_capacity
定义的能力乘以 R% 来控制刷脏页的速度。
这一整个流程对应的图片是这样的:
所以,我们需要关注内存中的脏页比例,让它尽量不要到75%,并且合理的设置 innodb_io_capacity
参数。
其中,针对脏页的比例,我们可以通过 Innodb_buffer_pool_pages_dirty/Innodb_buffer_pool_pages_total
去设置。
另外,由于 mysql 存在这样一个机制:如果要刷盘的脏页相邻的数据页恰好也是脏页,就一起写入磁盘,如果邻居的邻居也是如此。在机械硬盘时代这个策略可以减少随机IO,但是如果使用固态硬盘的话随机IO的性能往往比较高,所以使用这个策略反而拖累了查询性能。因此可以通过 innodb_flush_neighbors
关闭这个“连坐”的策略。
三、总结
innodb 有四种情况会触发脏页的刷盘:
- redo log 可写空间满了;
- 内存满了,需要淘汰的数据页恰好是脏页;
- 系统不繁忙的时候;
- 关闭数据库的时候。
innodb 通过的刷盘速度通过类似这样的公式计算:
innodb_io_capacity * Max( F(innodb_max_dirty_pages_pct), F(redo log的wp - redo log的cp) )
其中,
innodb_io_capacity
表示磁盘的最大IO能力;innodb_max_dirty_pages_pct
表示允许脏页在内存中的占比,默认值为75%;
当使用固态硬盘的时候,可以设置innodb_flush_neighbors
关闭默认的刷新相邻脏页的策略。