前言:
跑相同服務的服務器組合起來稱爲羣集
中心化羣集:有master、slave,
MHA用來解決羣集中master宕機的情況,
MMM羣集架構:有兩臺master服務器
MHA概述
- 日本DeNA公司youshimaton(現就職於Facebook公司)開發
- 一套優秀的作爲MySQL高可用性環境下故障切換和主從提升的高可用軟件
MHA的組成 - MHA Manager(管理節點)
- MHA Node(數據節點)
MHA特點 - 自動故障切換過程中,MHA試圖從宕機的主服務器上保存二進制日誌,最大程度的保證數據的不丟失
- 使用MySQL5.5的半同步複製,可以大大降低數據丟失的風險
案例拓撲圖
實驗環境
centos7版本
MHA版本0.57
mysql版本5.6.36
cmake版本2.8.6
MHA:192.168.191.132
master:192.168.191.160
slave1:192.168.191.161
slave2:192.168.191.162
搭建MySQL主從複製環境
1.修改主機名以便於區分各個服務器
三臺mysql服務器的安裝配置過程一致,所以就以master爲例
安裝編譯依賴的環境
安裝cmake編譯器
安裝mysql數據庫
接下來就是make && make install 的過程
優化mysql數據庫路徑,創建mysql用戶,初始化數據庫
vim /etc/my.cnf下:
修改主服務器master主配置文件
修改從服務器slave1主配置文件
修改從服務器slave2主配置文件
主從服務器做兩個軟連接,便於操作
主從服務器啓動MySQL
創建主從同步用戶myslavemysql> grant replication slave on *.* to 'myslave'@'192.168.191.%' identified by '123'; Query OK, 0 rows affected (0.00 sec)
給所有數據庫授權mha用戶對數據庫的操作權限
mysql> grant all privileges on *.* to 'mha'@'192.168.191.%' identified by 'manager'; Query OK, 0 rows affected (0.00 sec) mysql> grant all privileges on *.* to 'mha'@'master' identified by 'manager'; Query OK, 0 rows affected (0.00 sec) mysql> grant all privileges on *.* to 'mha'@'slave1' identified by 'manager'; Query OK, 0 rows affected (0.00 sec) mysql> grant all privileges on *.* to 'mha'@'slave2' identified by 'manager'; Query OK, 0 rows affected (0.00 sec) #刷新數據庫 mysql> flush privileges; Query OK, 0 rows affected (0.00 sec)
在mysql主服務器上查看爲禁止文件和同步點,此時不要往數據庫中添加任何內容,會導致
在從服務器上執行同步mysql> change master to master_host='192.168.191.160',master_user='myslave',master_password='123',master_log_file='master-bin.000002',master_log_pos=12215; Query OK, 0 rows affected, 2 warnings (0.00 sec) mysql> start slave; Query OK, 0 rows affected (0.01 sec) mysql> show slave status\G; ···省略部分內容 Slave_IO_Running: Yes //如果此處是Slave_IO_Running: Connecting,查看主服務器的防火牆是否關閉 Slave_SQL_Running: Yes ···省略部分內容
設置兩臺從服務器爲只讀模式
mysql> set global read_only=1; Query OK, 0 rows affected (0.00 sec)
安裝Node組件(所有服務器,版本爲0.57)
安裝perl環境
MHA對於每個操作系統版本不一樣,centos7.4必須選擇0.57版本,在所有服務器上必須先安裝node組件,最後在MHA-manager節點上安裝manager組件,因爲manager依賴node組件
安裝Node組件[root@master ~]# tar zxvf /abc/mha/mha4mysql-node-0.57.tar.gz [root@master ~]# cd mha4mysql-node-0.57/ [root@master mha4mysql-node-0.57]# perl Makefile.PL [root@master mha4mysql-node-0.57]# make [root@master mha4mysql-node-0.57]# make install
node安裝後在/usr/local/bin/下面生成幾個腳本工具(這些工具通常由MHA Manager腳本觸發,無需人爲操作)
save_binary_logs:保存和複製master的二進制文件
apply_diff_relay_logs:識別差異的中繼日誌事件並將其差異的事件應用於其他的slave
filter_mysqlbinlog:去除不必要的ROLLBACK回滾事件(MHA已不再使用這個工具)
purge_relay_logs:清除中繼日誌(不會阻塞SQL線程)
安裝Manager組件(在manager節點上,版本爲0.57)[root@manager ~]# tar zxvf /abc/mha/mha4mysql-manager-0.57.tar.gz [root@manager ~]# cd mha4mysql-manager-0.57/ [root@manager mha4mysql-manager-0.57]# perl Makefile.PL [root@manager mha4mysql-manager-0.57]# make [root@manager mha4mysql-manager-0.57]# make install
manager安裝後在/usr/local/bin/ 下面會生成幾個腳本工具
masterha_check_ssh:檢查MHA的SSH配置狀況
masterha_check_repl:檢查MySQL複製狀況
masterha_manager:啓動manager的腳本
masterha_check_status:檢測當前MHA運行狀態
masterha_master_monitor:檢測master是否宕機
masterha_master_switch:控制故障轉移(自動或者手動)
masterha_conf_host:添加或刪除配置server信息
masterha_stop:關閉manager
配置無密碼認證
工具:ssh-keygen、ssh-copy-id
(1)在manager上配置所有數據節點的無密碼認證[root@manager ~]# ssh-keygen -t rsa #一直點回車 [root@manager ~]# ssh-copy-id 192.168.191.160 [root@manager ~]# ssh-copy-id 192.168.191.161 [root@manager ~]# ssh-copy-id 192.168.191.162
(2)在master上配置到數據庫節點slave1和slave2的無密碼認證
#一直點回車 [root@master ~]# ssh-copy-id 192.168.191.161 [root@master ~]# ssh-copy-id 192.168.191.162
(3)在slave1上配置到數據庫節點master和slave2的無密碼認證
[root@slave1 ~]# ssh-keygen -t rsa #一直點回車 [root@slave1 ~]# ssh-copy-id 192.168.191.160 [root@slave1 ~]# ssh-copy-id 192.168.191.162
(4)在slave2上配置到數據庫節點master和slave1的無密碼認證
[root@slave2 ~]# ssh-keygen -t rsa #一直點回車 [root@slave2 ~]# ssh-copy-id 192.168.191.160 [root@slave2 ~]# ssh-copy-id 192.168.191.161
配置MHA(在manager節點上)
複製相關腳本到/usr/local/bin 目錄[root@manager ~]# cp -ra /root/mha4mysql-manager-0.57/samples/scripts /usr/local/bin
拷貝後會有四個執行文件
master_ip_failover:自動切換時VIP管理的腳本
master_ip_online_change:在線切換時vip的管理
power_manager:故障發生後關閉主機的腳本
send_report:因故障切換後發送報警的腳本
(2)複製上述的自動切換時VIP管理腳本到/usr/local/bin目錄中,使用腳本管理VIP[root@manager ~]# cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin
修改master_ip_failover腳本(刪除原有的內容,重新寫入)
[root@manager ~]# vim /usr/local/bin/master_ip_failover #!/usr/bin/env perl use strict; use warnings FATAL => 'all'; use Getopt::Long; my ( $command, $ssh_user, $orig_master_host, $orig_master_ip, $orig_master_port, $new_master_host, $new_master_ip, $new_master_port ); #############################添加內容部分######################################### #設置漂移IP my $vip = '192.168.191.200'; my $brdc = '192.168.191.255'; my $ifdev = 'ens33'; my $key = '1'; my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; my $exit_code = 0; #my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;"; #my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key"; ################################################################################## GetOptions( 'command=s' => \$command, 'ssh_user=s' => \$ssh_user, 'orig_master_host=s' => \$orig_master_host, 'orig_master_ip=s' => \$orig_master_ip, 'orig_master_port=i' => \$orig_master_port, 'new_master_host=s' => \$new_master_host, 'new_master_ip=s' => \$new_master_ip, 'new_master_port=i' => \$new_master_port, ); exit &main(); sub main { print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n"; if ( $command eq "stop" || $command eq "stopssh" ) { my $exit_code = 1; eval { print "Disabling the VIP on old master: $orig_master_host \n"; &stop_vip(); $exit_code = 0; }; if ($@) { warn "Got Error: $@\n"; exit $exit_code; } exit $exit_code; } elsif ( $command eq "start" ) { my $exit_code = 10; eval { print "Enabling the VIP - $vip on the new master - $new_master_host \n"; &start_vip(); $exit_code = 0; }; if ($@) { warn $@; exit $exit_code; } exit $exit_code; } elsif ( $command eq "status" ) { print "Checking the Status of the script.. OK \n"; exit 0; } else { &usage(); exit 1; } } sub start_vip() { `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`; } # A simple system call that disable the VIP on the old_master sub stop_vip() { `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`; } sub usage { print "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n"; }
注意:第一次配置需要去master上手動開啓虛擬IP
[root@master ~]# /sbin/ifconfig ens33:1 192.168.191.200/24
(4)創建MHA軟件目錄並拷貝配置文件
[root@manager ~]# mkdir /etc/masterha [root@manager ~]# cp /root/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha/ [root@manager ~]# vim /etc/masterha/app1.cnf [server default] #manager配置文件 manager_log=/var/log/masterha/app1/manager.log #manager日誌 manager_workdir=/var/log/masterha/app1 #master保存binlog的位置,這裏的路徑要與master裏配置的bilog的相同 master_binlog_dir=/home/mysql #設置自動failover時候的切換腳本。也就是上邊的那個腳本 master_ip_failover_script=/usr/local/bin/master_ip_failover #設置手動切換時候的切換腳本 master_ip_online_change_script=/usr/local/bin/master_ip_online_change #這個密碼是前文中創建監控用戶的那個密碼 password=manager ping_interval=1 remote_workdir=/tmp #設置複製用戶密碼 repl_password=123 #設置複製用戶的用戶 repl_user=myslave #設置發生切換後發生報警的腳本 secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.150.158 -s 192.168.150.244 #設置故障發生關閉故障腳本主機 shutdown_script="" #設置ssh的登錄用戶名 ssh_user=root #設置監控用戶 user=mha [server1] hostname=192.168.150.240 port=3306 [server2] #設置爲候選master,如果設置該參數以後,發送主從切換以後將會從此從庫升級爲主庫 candidate_master=1 #默認情況下如果一個slave落後master 100M的relay logs的話,MHA將不會選擇該slave爲新的master check_repl_delay=0 hostname=192.168.150.158 port=3306 [server3] hostname=192.168.150.244 port=3306
測試
SSH免交互登陸(manager節點[root@manager ~]# masterha_check_ssh -conf=/etc/masterha/app1.cnf ···省略部分內容 #如果正常會輸出successfully Sun Jan 12 19:19:11 2020 - [info] All SSH connection tests passed successfully.
啓動MHA,查看MHA狀態
#啓動MHA,放在後臺運行 [root@manager ~]# nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 & [1] 13525 #查看MHA狀態,可以看到當前的master是mysql節點 [root@manager ~]# masterha_check_status --conf=/etc/masterha/app1.cnf app1 (pid:13525) is running(0:PING_OK), master:192.168.191.200
- –remove_dead_master_conf:該參數代表當發生主從切換後,老的ip將會從配置文件中移除
- –ignore_last_failover:在缺省情況下,如果MHA檢測到連續發生宕機,且兩次宕機間隔不足8小時的話,則不會進行failover,之所以這樣限制是爲了避免ping-pong效應,該參數代表忽略上次MHA觸發切換後產生的文件,默認情況下,MHA發生切換後會在日誌記目錄,也就是上面設置的appl.failover.complete文件,下次再次切換的時候如果發現該目錄下存在該文件將不允許觸發切換,除非在第一次切換後收到刪除該文件,爲了方便,這裏設置爲–ignore_last_failover
在manager上啓動監控觀察日誌記錄
模擬故障
在主庫master上執行停掉mysql服務[root@master ~]# pkill -9 mysqld
此時manager監測到主服務器宕機,切換備用主服務器爲主服務器
在slave1上查看IP地址[root@slave1 ~]# ifconfig ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.191.160 netmask 255.255.255.0 broadcast 192.168.191.255 ··· #虛擬IP地址轉換到備用主服務器 ens33:1: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.191.200 netmask 255.255.255.0 broadcast 192.168.191.255 ···
此時,使用客戶端通過虛擬IP地址登陸,也可登錄。
MHA高可用配置及故障切換實驗就完成了。