MHA配置安裝包下載地址
1.
https://github.com/yoshinorim?tab=repositories
2. mha4mysql-manager/releases/tag/v0.58
https://github.com/yoshinorim/mha4mysql-manager/releases/tag/v0.58
3.mha4mysql-node/releases/tag/v0.58
https://github.com/yoshinorim/mha4mysql-node/releases/tag/v0.58
4.perl-Config-Tiny-2.23-2.3.noarch.rpm 下載地址
ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/tomasl/CentOS_7/noarch/perl-Config-Tiny-2.23-2.3.noarch.rpm
5. 配置腳本
[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1
master_binlog_dir=/usr/local/mysql/data
user=mha
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306
6. failover配置腳本
my $vip = '10.10.10.85/24'; #需要修改成你自己的IP
my $key = '0'; #設置0 後 ens37:0 eth0:0 當然也可以是1 一定要一致
my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip"; #需要確定網卡名字 ens37 還是eth0
my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down"; #需要確定網卡名字 ens37 還是eth0
[root@mysql-db03 bin]# ll
total 4
-rwxr-xr-x 1 root root 2170 Jan 23 23:34 master_ip_failover
[root@mysql-db03 bin]# more master_ip_failover
#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';
use Getopt::Long;
my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
my $vip = '10.10.10.85/24';
my $key = '0';
my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down";
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);
exit &main();
sub main {
print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
if ( $command eq "stop" || $command eq "stopssh" ) {
my $exit_code = 1;
eval {
print "Disabling the VIP on old master: $orig_master_host \n";
&stop_vip();
$exit_code = 0;
};
if ($@) {
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {
my $exit_code = 10;
eval {
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
&start_vip();
$exit_code = 0;
};
if ($@) {
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
print "Checking the Status of the script.. OK \n";
exit 0;
}
else {
&usage();
exit 1;
}
}
sub start_vip() {
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
sub stop_vip() {
return 0 unless ($ssh_user);
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
sub usage {
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}
6.
#主機的IP配置
[root@mysql-db03 bin]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
10.10.10.81 mysql-db01
10.10.10.82 mysql-db02
10.10.10.83 mysql-db03
10.10.10.85 mysql-vip
主庫操作
#修改配置文件
#編輯mysql配置文件
[root@mysql-db01 ~]# vim /etc/my.cnf
#在mysqld標籤下配置
[mysqld]
#主庫server-id爲1,從庫不等於1
server_id =1
#開啓binlog日誌
log_bin=mysql-bin
#創建主從複製用戶
#登錄數據庫
[root@mysql-db01 ~]# mysql -uroot -p123456
#創建rep用戶 三個節點都配置上,否則MHA配置時候會報錯
mysql> grant replication slave on *.* to rep@'10.10.10.%' identified by '123456';
從庫操作
修改配置文件
#修改mysql-db02配置文件
[root@mysql-db02 ~]# vim /etc/my.cnf
#在mysqld標籤下配置
[mysqld]
#主庫server-id爲1,從庫必須大於1
server_id =5
#開啓binlog日誌
log_bin=mysql-bin
#重啓mysql
[root@mysql-db02 ~]# /etc/init.d/mysqld restart
#修改mysql-db03配置文件
[root@mysql-db03 ~]# vim /etc/my.cnf
#在mysqld標籤下配置
[mysqld]
#主庫server-id爲1,從庫必須大於1
server_id =10
#開啓binlog日誌
log_bin=mysql-bin
#重啓mysql
[root@mysql-db03 ~]# /etc/init.d/mysqld restart
注:在以往如果是基於binlog日誌的主從複製,則必須要記住主庫的master狀態信息。
mysql> show master status;
+------------------+----------+
| File | Position |
+------------------+----------+
| mysql-bin.000002 | 120 |
+------------------+----------+
開啓GTID
#沒開啓之前先看一下GTID的狀態
mysql> show global variables like '%gtid%';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| enforce_gtid_consistency | OFF |
| gtid_executed | |
| gtid_mode | OFF |
| gtid_owned | |
| gtid_purged | |
+--------------------------+-------+
#編輯mysql配置文件(主庫從庫都需要修改)
[root@mysql-db01 ~]# vim /etc/my.cnf
#在[mysqld]標籤下添加
[mysqld]
gtid_mode=ON
log_slave_updates
enforce_gtid_consistency
#重啓數據庫
[root@mysql-db01 ~]# /etc/init.d/mysqld restart
#檢查GTID狀態
mysql> show global variables like '%gtid%';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| enforce_gtid_consistency | ON | #執行GTID一致
| gtid_executed | |
| gtid_mode | ON | #開啓GTID模塊
| gtid_owned | |
| gtid_purged | |
+--------------------------+-------+
注:主庫從庫都需要開啓GTID否則在做主從複製的時候就會報錯:
[root@mysql-db02 ~]# mysql -uroot -p123456
mysql> change master to
-> master_host='10.10.10.51',
-> master_user='rep',
-> master_password='123456',
-> master_auto_position=1;
ERROR 1777 (HY000): CHANGE MASTER TO MASTER_AUTO_POSITION = 1 can only be executed when @@GLOBAL.GTID_MODE = ON.
配置主從複製
#登錄數據庫
[root@mysql-db02 ~]# mysql -uroot -p123456
#配置複製主機信息
mysql> change master to
#主庫IP
-> master_host='10.10.10.81',
#主庫複製用戶
-> master_user='rep',
#主庫複製用戶的密碼
-> master_password='123456',
#GTID位置點
-> master_auto_position=1;
#開啓slave
mysql> start slave;
#查看slave狀態
mysql> show slave status\G
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 10.10.10..51
Master_User: rep
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: mysql-bin.000003
Read_Master_Log_Pos: 403
Relay_Log_File: mysql-db02-relay-bin.000002
Relay_Log_Pos: 613
Relay_Master_Log_File: mysql-bin.000003
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 403
Relay_Log_Space: 822
Until_Condition: None
從庫設置
#登錄從庫
[root@mysql-db02 ~]# mysql -uroot -p123456
#禁用自動刪除relay log 功能
mysql> set global relay_log_purge = 0;
#設置只讀
mysql> set global read_only=1;
#編輯配置文件
[root@mysql-db02 ~]# vim /etc/my.cnf
#在mysqld標籤下添加
[mysqld]
#禁用自動刪除relay log 永久生效
relay_log_purge = 0
環境準備(所有節點)
#安裝依賴包
[root@mysql-db01 ~]# yum install perl-DBD-MySQL -y
#進入安裝包存放目錄
[root@mysql-db01 ~]# cd /home/tools/
#上傳mha安裝包
[root@mysql-db01 tools]# rz -be
mha4mysql-node-0.58-0.el7.centos.noarch.rpm
mha4mysql-manager-0.58-0.el7.centos.noarch.rpm
#安裝node包
[root@mysql-db01 tools]# mha4mysql-node-0.58-0.el7.centos.noarch.rpm
Preparing... ########################################### [100%]
1:mha4mysql-node ########################################### [100%]
#登錄數據庫
[root@mysql-db01 tools]# mysql -uroot -p123456
#添加mha管理賬號
mysql> grant all privileges on *.* to mha@'10.0.0.%' identified by 'mha';
#查看是否添加成功
mysql> select user,host from mysql.user;
#主庫上創建,從庫會自動複製(在從庫上查看)
mysql> select user,host from mysql.user;
命令軟連接(所有節點)
#如果不創建命令軟連接,檢測mha複製情況的時候會報錯
[root@mysql-db01 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/bin/mysqlbinlog
[root@mysql-db01 ~]# ln -s /usr/local/mysql/bin/mysql /usr/bin/mysql
部署管理節點(mha-manager)
在mysql-db03上部署管理節點
#使用epel源
[root@mysql-db03 ~]# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
#安裝manager依賴包
[root@mysql-db03 ~]# yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
#安裝manager包
[root@mysql-db03 tools]# rpm -ivh mha4mysql-manager-0.58-0.el7.centos.noarch.rpm
Preparing... ########################################### [100%]
1:mha4mysql-manager ########################################### [100%]
#編輯配置文件
#創建配置文件目錄
[root@mysql-db03 ~]# mkdir -p /etc/mha
#創建日誌目錄
[root@mysql-db03 ~]# mkdir -p /var/log/mha/app1
#編輯mha配置文件
[root@mysql-db03 ~]# vim /etc/mha/app1.cnf
[server default]
manager_log=/var/log/mha/app1/manager
manager_workdir=/var/log/mha/app1
master_binlog_dir=/application/mysql/data
user=mha
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306
注意dos2unix app1.cnf
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
【配置文件詳解】
[server default]
#設置manager的工作目錄
manager_workdir=/var/log/masterha/app1
#設置manager的日誌
manager_log=/var/log/masterha/app1/manager.log
#設置master 保存binlog的位置,以便MHA可以找到master的日誌,我這裏的也就是mysql的數據目錄
master_binlog_dir=/data/mysql
#設置自動failover時候的切換腳本
master_ip_failover_script= /usr/local/bin/master_ip_failover
#設置手動切換時候的切換腳本
master_ip_online_change_script= /usr/local/bin/master_ip_online_change
#設置mysql中root用戶的密碼,這個密碼是前文中創建監控用戶的那個密碼
password=123456
#設置監控用戶root
user=root
#設置監控主庫,發送ping包的時間間隔,嘗試三次沒有迴應的時候自動進行failover
ping_interval=1
#設置遠端mysql在發生切換時binlog的保存位置
remote_workdir=/tmp
#設置複製用戶的密碼
repl_password=123456
#設置複製環境中的複製用戶名
repl_user=rep
#設置發生切換後發送的報警的腳本
report_script=/usr/local/send_report
#一旦MHA到server02的監控之間出現問題,MHA Manager將會嘗試從server03登錄到server02
secondary_check_script= /usr/local/bin/masterha_secondary_check -s server03 -s server02 --user=root --master_host=server02 --master_ip=192.168.0.50 --master_port=3306
#設置故障發生後關閉故障主機腳本(該腳本的主要作用是關閉主機放在發生腦裂,這裏沒有使用)
shutdown_script=""
#設置ssh的登錄用戶名
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
hostname=10.10.10.82
port=3306
#設置爲候選master,如果設置該參數以後,發生主從切換以後將會將此從庫提升爲主庫,即使這個主庫不是集羣中事件最新的slave
candidate_master=1
#默認情況下如果一個slave落後master 100M的relay logs的話,MHA將不會選擇該slave作爲一個新的master,因爲對於這個slave的恢復需要花費很長時間,通過設置check_repl_delay=0,MHA觸發切換在選擇一個新的master的時候將會忽略複製延時,這個參數對於設置了candidate_master=1的主機非常有用,因爲這個候選主在切換的過程中一定是新的master
check_repl_delay=0
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
配置ssh信任(所有節點)
#創建祕鑰對
[root@mysql-db01 ~]# ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa >/dev/null 2>&1
#發送公鑰,包括自己
[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub [email protected]
[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub [email protected]
[root@mysql-db01 ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub [email protected]
啓動測試
#測試ssh
[root@mysql-db03 ~]# masterha_check_ssh --conf=/etc/mha/app1.cnf
#看到如下字樣,則測試成功
- [info] All SSH connection tests passed successfully.
#測試複製
[root@mysql-db03 ~]# masterha_check_repl --conf=/etc/mha/app1.cnf
#看到如下字樣,則測試成功
MySQL Replication Health is OK.
4.6啓動MHA
#啓動
[root@mysql-db03 ~]# nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &
IP漂移的兩種方式
通過keepalived的方式,管理虛擬IP的漂移
通過MHA自帶腳本方式,管理虛擬IP的漂移
#MHA腳本方式
#修改配置文件
#編輯配置文件
[root@mysql-db03 ~]# vim /etc/mha/app1.cnf
#在[server default]標籤下添加
[server default]
#使用MHA自帶腳本
master_ip_failover_script=/usr/local/bin/master_ip_failover
#編輯腳本
#根據配置文件中腳本路徑編輯
[root@mysql-db03 ~]# vim /etc/mha/master_ip_failover
#修改以下幾行內容
my $vip = '10.10.10.85/24';
my $key = '0';
my $ssh_start_vip = "/sbin/ifconfig ens37:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig ens37:$key down";
#添加執行權限,否則mha無法啓動
[root@mysql-db03 ~]# chmod +x /etc/mha/master_ip_failover
5.2.3手動綁定VIP
#綁定vip
[root@mysql-db01 ~]# ifconfig ens37:0 10.10.10.85/24
#查看vip
[root@mysql-db01 ~]# ip a |grep ens37
2: ens37: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
inet 10.10.10.81/24 brd 10.10.10.255 scope global ens37
inet 10.10.10..85/24 brd 10.10.10.255 scope global secondary ens37:0
注意點:
主節點停掉後 ,MHA會停掉
舊主節點要啓動後通過查詢以下內容可以找到 文件號以及地址
grep -i "change master to " /var/log/mha/app1/manager.log
可以找到信息,修改下密碼,然後start slave,舊主庫就會恢復
注意
/etc/mha/app1.cnf文件內容會改變,啓動前應該加上
[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1
master_binlog_dir=/usr/local/mysql/data
user=mha
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306
如果用了failover了
[root@mysql-db03 bin]# more /etc/mha/app1.cnf
[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1
master_binlog_dir=/usr/local/mysql/data
master_ip_failover_script=/usr/local/bin/master_ip_failover ---這個需要放在這裏
password=mha
ping_interval=2
repl_password=123456
repl_user=rep
ssh_user=root
user=mha
[server1]
hostname=10.10.10.81
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=10.10.10.82
port=3306
[server3]
hostname=10.10.10.83
port=3306
然後再啓動mgr
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/mha/app1/manager.log 2>&1 &