nagios自寫插件監控某個程序使用物理內存情況

前幾天在工作中遇到了一個問題,nagios自寫插件,單獨測試命令和插件沒有問題,但是通過check_nrpe插件調用自寫插件的時候會出現問題。

下面是我寫的一個插件,主要功能是:輸入一個端口號,就可以知道監聽該端口號的程序使用物理內存情況。

#!/bin/bash
if [ $# -ne 1 ];then
    echo "Usage:$0 num1"
    exit 5;
fi

PORT="$1"
LINE=$(sudo netstat -lnutp|awk -F '[: ]+' '{print $5}'|grep -w ${PORT}|wc -l)
if [ $LINE -eq 1 ];then
   PID=$(sudo netstat -lnutp|awk -F '[: ]+' '$5=='$PORT'{print $(NF-1)}'|awk -F '/' '{print $1}')
   PS_NAME=$(sudo netstat -lnutp|awk -F '[: ]+' '$5=='$PORT'{print $(NF-1)}'|awk -F '/' '{print $2}' )
   MEM=$(ps -p ${PID} -o rss|grep -v RSS)
   MEMD=$(expr ${MEM}  "*" 1024)
   echo "OK port-${PORT} ${PS_NAME} use mem ${MEMD}b |MEM=${MEMD}b;5000;10000;0"
   exit 0
else
   
   echo "port-${PORT} is not  exist"
   exit 2

fi

編寫該插件的時候有兩個細節需要注意

1、nagios賬號執行netstat命令時沒有權限查看其它賬號啓動的程序。所以需要用sudo ,所以在/etc/sudoers添加如下內容:

nagios ALL=(ALL) NOPASSWD: /bin/netstat

使用nagios賬號免密碼執行/bin/netstat命令。

2、查看某個程序使用物理內存情況:

我的80端口nginx程序PID是:643

方法一:

ps -p PID -o rss

[root@nagios-server libexec]# ps -p 643 -o rss
  RSS
 2700

方法二:

cat /proc/PID/status

[root@nagios-server libexec]# cat /proc/643/status | grep RSS
VmRSS:      2700 kB


測試:

我們用80端口測試:

首先我們查看80端口是否開啓和監控的程序:

[root@nagios-server libexec]# netstat -lntp|awk -F '[ :]+' '$5=="80"{print}'
tcp        0      0 0.0.0.0:80                  0.0.0.0:*                   LISTEN      643/nginx

1、測試插件:

[root@nagios-server libexec]# sh check_ps_mem.sh 80
OK port-80 nginx use mem 2764800b |MEM=2764800b;5000;10000;0

由以上結果可知,80端口的nginx程序使用的物理內存情況插件執行成功。

2、編輯/usr/local/nagios/etc/nrpe.cfg文件:

command[check_ps_mem]=/usr/local/nagios/libexec/check_ps_mem.sh 80

3、用check_nrpe插件測試:

[root@nagios-server libexec]# /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c check_ps_mem               
port-80 is not  exist

用root賬號,通過check_nrpe沒有抓到數據;

4、用nagios賬號執行check_nrpe測試:

[root@nagios-server libexec]# sudo -u nagios /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c check_ps_mem
port-80 is not  exist

結果:用nagios賬號也是是沒有抓到數據。如果nagios賬號無法抓取到數據,就算添加到監控也是無法抓到數據。


問題原因:

腳本里/bin/netstat 命令是用sudo執行的。sudo無法在後端執行,執行sudo時要開啓tty終端的。用check_nrpe調用腳本時,是在後端執行的sudo  。 好了,問題原因找到了。

解決方法:

在/etc/sudoers文件裏添加如下內容:

Defaults:nagios !requiretty


再次測試:

添加  Defaults:nagios !requiretty 後測試:

[root@nagios-server libexec]# /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c check_ps_mem               
OK port-80 nginx use mem 2764800b |MEM=2764800b;5000;10000;0


[root@nagios-server libexec]# sudo -u nagios /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c check_ps_mem
OK port-80 nginx use mem 2764800b |MEM=2764800b;5000;10000;0



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章