shell腳本監控系統負載、CPU和內存使用情況

#一.編寫系統負載監控的腳本文件
#!/bin/bash

########################################################################
#This scripts is checking the system load,vision 0.1
#Author:HeJunyi
#E-mail:158****[email protected]
########################################################################

#使用uptime命令監控linux系統負載變化
 
#提取本服務器的IP地址信息
IP=`ifconfig eth1 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "`
 
#抓取cpu的總核數
cpu_num=`grep -c 'model name' /proc/cpuinfo`
 
#抓取當前系統15分鐘的平均負載值
load_15=`uptime | awk '{print $NF}'`
 
#計算當前系統單個核心15分鐘的平均負載值,結果小於1.0時前面個位數補0。
average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" | bc`  ##scale表示小數精度位數
 
#取上面平均負載值的個位整數
average_int=`echo $average_load | cut -f 1 -d "."`
 
#設置系統單個核心15分鐘的平均負載的告警值爲0.70(即使用超過70%的時候告警)。
load_warn=0.70
 
#當單個核心15分鐘的平均負載值大於等於1.0(即average_int個位整數大於0);如果小於1.0則進行二次比較
if (($average_int > 0)); then
      echo "$IP服務器15min平均負載達到$average_load,超過警戒值1.0,請立即處理!"
else
#當前系統15分鐘平均負載值與告警值進行比較(當大於成立會返回1,小於時會返回0 )
load_now=`expr $average_load \> $load_warn`
 
#如果系統單個核心15分鐘的平均負載值大於告警值0.70(返回值爲1),則發郵件給管理員
 if (($load_now == 1)); then
    echo "$IP服務器15min平均負載達到$average_load,超過警戒值0.00,請及時處理"
 fi
fi


二、監控系統cpu的情況
#!/bin/bash

########################################################################
#This scripts is checking the cpu,vision 0.1
#Author:HeJunyi
#E-mail:158****[email protected]
########################################################################
 
#提取本服務器的IP地址信息
IP=`ifconfig eth1|grep "inet addr"|awk '{print $2}'|cut -f2 -d":"`
 
#取當前空閒cpu百份比值
cpu_id=`top -b -n1|grep "Cpu"|awk '{print $5}'|cut -f1 -d"%"`

#取當前空閒cpu百份比值的整數部分
cpu_int=`echo $cpu_id|cut -f1 -d"."`
 
#設置空閒cpu的告警值爲20%(即剩餘小於20%)
if (($cpu_id < 20)); then
 echo "$IP服務器cpu剩餘:$cpu_id%,請及時處理"
else
 echo "$IP服務器cpu剩餘:$cpu_id%"
fi


三、監控系統內存
#!/bin/bash

########################################################################
#This scripts is checking the free_mem,vision 0.1
#Author:HeJunyi
#E-mail:158****[email protected]
########################################################################
 
#抓取物理內存free值
echo Mem-free: `free -m | grep Mem | awk '{print $4}'`M  
 
#抓取緩衝區的free值
echo buffers/cache-free: `free -m | grep - | awk '{print $4}'`M
 
#抓取Swap分區free值
echo Swap-free: `free -m | grep Swap | awk '{print $4}'`M


四、監控系統交換分區swap的情況
#!/bin/bash

########################################################################
#This scripts is checking the swap,vision 0.1
#Author:HeJunyi
#E-mail:158****[email protected]
########################################################################
 
#提取本服務器的IP地址信息
IP=`ifconfig eth1 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "`
 
#系統分配的交換分區總量
swap_total=`free -m | grep Swap | awk '{print  $2}'`
 
#當前剩餘的交換分區free大小
swap_free=`free -m | grep Swap | awk '{print  $4}'`
 
#當前已使用的交換分區used大小
swap_used=`free -m | grep Swap | awk '{print  $3}'`


#設置交換分區的告警值爲20%
swap_warn=0.20

if (($swap_used != 0)); then
 
#如果交換分區已被使用,則計算當前剩餘交換分區free所佔總量的百分比,用小數來表示,要在小數點前面補一個整數位0
   swap_per=`echo "scale=2;b=$swap_free/$swap_total;if(length(b)==scale(b)) print 0;print b"|bc`

#當前剩餘交換分區百分比與告警值進行比較(當小於告警值20%時會返回1,小於大於時會返回0 )
   swap_now=`expr $swap_per \< $swap_warn`
 
#如果當前交換分區使用即剩餘小於20%(上面的返回值等於1)
  if (($swap_now ==1));then
  echo "$IP服務器swap交換分區使用率達到80%,只剩下"$swap_free"M 未使用,請及時處>理!"
 fi
fi

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章