Mysql 系列之：如何正確地對 Mysql 實例做健康檢查

原創

wenxueliu@HW

2020-06-07 07:54

問題

select 1 做節點健康檢查有啥問題？
如何正確地做實例監控檢查？

Mysql 高可用架構

Mysql 的 HA 架構包括一主一備、雙主、一主一備多從。既然是高可用，必然涉及切換。

主備切換包括兩種場景

主動切換：一般爲計劃內的切換，需要升級，降級等各種情況
被動切換：一般爲異常導致節點切換。由 HA 系統發起。

那麼，Mysql 檢查節點異常的正確姿勢是啥呢？

常用的的檢查 mysql 的方法是

select  1

，那麼，這樣做有哪些問題，正確如何做呢？

異常情況

情況一、由於併發線程數達到上限，真正查詢請求無法處理。

併發線程數由參數 innodb_thread_concurrency 決定。但 select 1 這樣的請求不會阻塞。解決辦法就是在數據庫建一張表 health_check，通過查詢來檢查。

情況二、由於磁盤空間耗盡，所有的更新和事務提交操作不可用，但是數據查詢還是可用的。

情況三、由於是高可用架構，區分不同節點的檢測

情況四、判斷不夠及時

解決辦法：

對於情況一和二：採用如下方法

創建一張表，以 service_id 爲主鍵，不同節點執行不同的更新

CREATE TABLE `health_check` (  `id` int(11) NOT NULL,  `t_modified` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,  PRIMARY KEY (`id`)) ENGINE=InnoDB;

insert into mysql.health_check(id, t_modified) values (@@server_id, now()) on duplicate key update t_modified=now();

對於情況三：

select event_name,MAX_TIMER_WAIT  FROM performance_schema.file_summary_by_event_name where event_name in ('wait/io/file/innodb/innodb_log_file','wait/io/file/sql/binlog') and MAX_TIMER_WAIT>200*1000000000;


truncate table performance_schema.file_summary_by_event_name;

如何正確配置，參考附錄。

總結

Mysql 如何監控節點的監控的點，你 get 到了麼？

附錄

開啓 redo log 監控

# 查詢 redo log 統計開關是否打開
select * from performance_schema.setup_instruments where name like '%wait/io/file/innodb/innodb_log_file%';
# 開啓 redo log
update performance_schema.setup_instruments set ENABLED='YES', Timed='YES' where name like '%wait/io/file/innodb/innodb_log_file%'

# 查詢 redo log 統計信息
select * from performance_schema.file_summary_by_event_name where event_name = 'wait/io/file/innodb/innodb_log_file';

開啓 binlog 監控

# 查詢 binlog 統計開關是否開啓
select * from performance_schema.setup_instruments where name like '%wait/io/file/sql/binlog%';

# 開啓 binlog
update performance_schema.setup_instruments set ENABLED='YES', Timed='YES' where name like '%wait/io/file/sql/binlog%'

# 查詢 binlog 統計信息
select * from performance_schema.file_summary_by_event_name where event_name = 'wait/io/file/sql/binlog';

注：打開 performance_schema 全部的統計，大約有 10 % 的性能損耗，因此建議，打開需要的統計。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Mysql 系列之：如何正確地對 Mysql 實例做健康檢查

問題

Mysql 高可用架構

異常情況

解決辦法：

總結

附錄

開啓 redo log 監控

開啓 binlog 監控

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

Garnet：微軟官方基於.NET開源的高性能分佈式緩存存儲數據庫

Flink執行圖

Java響應式編程

評估統計算法在銀行僞造鈔票檢測中的價值

5 分鐘精通一致性 Hash

架構設計-第三週作業

架構設計作業第 4 周

Spring 核心原理 5 分鐘： spring 處理請求的主流程是怎樣的？

5 分鐘掌握 Java 源碼分析：Integer 源碼解讀

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結