本腳本來自有學習阿銘的博文學習:
在大數的互聯網公司,其數據庫都使用開源的MySQL,其架構也是主從爲主,所以監控數據庫主從同步情況尤爲重要。
提示:本文中的S全部都$符,不要問爲什麼,馬雲爸爸的社區就這樣。
#!/bin/bash
#用途:監控MySQL數據庫的主從狀態的shell的腳本。
#作者:Caron maktini
#日期:2018年11月19日
#版本:v0.1
#要求如下:每分鐘檢測一次主從連接狀況,未連接則不再執行;不同步情況發生後將向預留郵箱報警;在沒有解決情況下,需要每隔30分鐘發一次告警郵件。
#把腳本名字存入變量s_name
s_name=`echo $0 | awk -F '/' '{print $NF}'`
Mysql_c="mysql -uroot -p密碼"
#該函數實現郵件告警收斂
m_mail(){
log=$1
t_s=`date +%s`
t_s2=`date -d " 1 hours ago" +%s`
if [ ! -f /tmp/$log ]
then
#創建$log文件
touch /tmp/$log
#增加a權限。只允許追加內容,不允許更改或者刪除
chattr +a /tmp/$log
#第一次告警,可以直接寫入1小時的時間戳
echo St_s >> /tmp/$log
fi
#無論$log文件是否剛剛創建,都需要查看最後一行的時間戳
t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
#取出最後一行即上次告警的時間戳後,立即寫入當前的時間戳
echo St_s>>/tmp/$log
#取兩次時間戳差值
v=S[St_s-$t_s2]
#如果差值超過1800,立即發郵件
if [ $v -gt 1800 ]
then
#發郵件,其中$2爲mail函數的第二個參數,這裏爲一個文件
python mail.py Smail_user S1 "`cat $2`" 2>/dev/null
#定義計算器臨時文件,並寫入0
echo "0" > /tmp/$log.count
else
#如果計算器臨時文件不存在,需要創建並寫入0
if [ ! -f /tmp/$log.count ]
then
echo "0" > /tmp/$log.count
fi
nu=`cat /tmp/$log.count`
#30分鐘內每發生異常告警,計算器加1
nu2= S [ Snu +1 ]
echo Snu2>/tmp/$log.count
#當告警次數到達30次需要發郵件
if [ $nu2 -gt 30 ]
then
python mail.py $mail_user "$1 30 min " " `cat $2`" 2>/dev/null
#第二次告警後,將計算器再次從0開始
echo "0" > /tmp/$log.count
fi
fi
}
#把進程情況存入臨時文件,如果加管道求行數會有問題
ps aux | grep "$s_name" | grep -vE "$$|grep">/tmp/ps.tmp
p_n=`wc -l /tmp/ps.tmp | awk '{print $1}'`
#當進程數大於0,則說明上次的腳本還未執行完
if [ $p_n -gt 0 ]
then
exit
fi
先執行一條執行show processlist, 看是否執行成功
$Mysql_c -e "show processlist" > /tmp/mysql_pro.log 2>/tmp/mysql_log.err
#如果上一條命令執行不成功,說明這個MySQL服務出了問題。
if [ $? -gt 0 ]
then
m_mail mysql_service_error /tmp/mysql_log.err
exit
else
$Mysql_c -e "show slave status\G" >/tmp/mysql_s.log
n1=`wc -l /tmp/mysql_s.log|awk '{print $1}'`
if [ $n1 -gt 0 ]
then
y1=`grep 'Slave_IO-Running:' /tmp/msyql_s.log|awk -F : '{print $2} ' | sed s# ##g'`
y2=`grep 'Slave_SQL-Running:' /tmp/msyql_s.log|awk -F : '{print $2} ' | sed s# ##g'`
if [ Sy1 == "NO" ] || [ $y2 == "NO" ]
then
m_mail mysql_slavestatus_error /tmp/mysql_s.log
fi
fi
fi