故障案例--寻找瓶颈SQL的一种方法

故障现象

DB响应非常慢,连接数暴涨直到打满;

任何SQL看起来都是慢查询,都要几十秒以上;

show  processlist时SQL种类非常多,短时间无法分辨哪个是引起故障的SQL,挑了几个看SQL问题不大;

CPU,IO都非常低,看样子无系统瓶颈,也无任何硬件层面的报错;

故障原因和定位方法

猜测是高并发引起的性能瓶颈,通过show engine innodb status\G结果看存在大量的sleeping before entering InnoDB,也就是说大量的SQL没法进入innodb内部执行,存在排队现象,从而导致这些原本没问题的SQL也都变成了慢查询。

一开始怀疑是innodb_thread_concurrency的问题,发现参数设置较为合理,排除这个原因;

发现show  engine innodb status\G中的事务还能查看当前正在innodb内部执行的SQL,通过搜索关键词inside Innodb即可,数量正好与innodb_thread_concurrency相当,于是确定就是这个SQL引起的,发现这个SQL就是无脑的select * from XX的全表扫描,下线该SQL后问题得到解决


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章