1. 首先yum安装如下支持包:
yum install gcc glibc glibc-common gd gd-devel openssl openssl-devel
2. 建立nagios所需的用户及用户组
/usr/sbin/useradd nagios
passwd nagios
/usr/sbin/usermod -G nagcmd nagios
/usr/sbin/usermod -G nagcmd apache
3. 下载nagios及nagios-plugin软件包:
wget http://prdownloads.sourceforge.net/sourceforge/nagios/nagios-3.5.0.tar.gz
wget http://prdownloads.sourceforge.net/sourceforge/nagiosplug/nagios-plugins-1.4.16.tar.gz
安装nagios及nagios-plugin插件
nagios:
./configure --with-command-group=nagcmd
make all
make install
make install-init
make install-config
make install-commandmode
make install-webconf
nagios-plugin:
./configure --with-nagios-user=nagios --with-nagios-group=nagios
make make install
4.
安装 nrpe
wget http://downloads.sourceforge.net/project/nagios/nrpe-2.x/nrpe-2.14/nrpe-2.14.tar.gz?r=&ts=1363788540&use_mirror=hivelocity
tar zxvfnrpe-2.14.tar.gz
cd nrpe
./configure make all make install-plugin
5. 设置nagios管理密码:htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
6. 将nagios加入系统服务:
chkconfig --add nagios
chkconfig nagios on
7. 验证nagios配置,看是否正常,
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
正常,则启动nagios服务:
/ete/init.d/nagios start
7. linux系统的SElinux默认为强制模式,这样会导致nagios报“内部错误”,所以需要将强制模式改为容许模式:
setenforce 0
如此,即能浏览nagios了
二: 客户端安装配置
安装 nagios-plugin nrpe
nagios-plugin:
./configure --with-nagios-user=nagios --with-nagios-group=nagios
make make install
nrpe:
- ./configure
- make all
- make install-plugin
- make install-daemon
- make install-daemon-config
下面介绍nagios相关服务项,报警配置
时间紧迫,暂时先转载一下,稍后自己修改
nagios监控应用分两块, 一块为服务器端,一块为客户端。服务端配置文件在/usr/local/nagios/etc/objects,即可以监控linux,又可以监控windows,同时也可以监控打印机,和交换机。同时也可以发邮件。
服务端监控linux服务器的文件为/usr/local/ngios/etc/localhost.cfg,最主要分为三块。
define host{
use linux-server ; Name of host template to use
; This host definition will inherit all variables that are defined
; in (or inherited by) the linux-server host template definition.
host_name
alias
address
}
这个为主机块,需要告诉nagios,计算机名,别名,地址,使用的是 linux
define hostgroup{
hostgroup_name ; The name of the hostgroup
alias ; Long name of the group
members ; Comma separated list of hosts that belong to this group
}
这块为主机组名,别名,成员。
define service{
use local-service ; Name of service template to use
hostgroup_name
service_description checksapce_root
check_command check_local_disk!20%!10%!/root
}
这块就是可以监控的本地的服务名。
define service{
use local-service ; Name of service template to use
hostgroup_name
service_description HTTP
check_command check_http
notifications_enabled 1
}
这块跟上面一样,最主要的是本地服务。
nagios即可以监控进程,也可以监控端口。/usr/local/nagios/libexec,这个目录最主要放nagios监控插件,只要check_*** -h,就可以跟据显示来增加参数。也可以自己写脚本。
/usr/local/nagios/etc/cotacts.cfg,这份文件主要有两块,一块是要发送的邮件,一块是用户名。
/usr/local/nagios/etc/commands.cfg,最主要添加命令参数。
/usr/local/nagios/etc/printer.cfg,是监控打印机参数。
/usr/local/nagios/etc/switch.cfg,是监控网络设备,要开起snmp协议。
/usr/local/ngios/etc/templates.cfg,是监控服务器的一些网络信息,比如能否通,是否宕机。
/usr/local/nagios/etc/timeperods.cfg,是时间上的监控,你可以哪段时间进行监控,哪段时间不监控。
/usr/local/nagios/etc/windows.cfg,是监控windows服务器的
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg 这句话是可以检查你的配置文件那条有错。
在/usr/local/nagios/etc/resource.cfg文件里面你可以增加用户,比如oracle
在客户端里面最主要改的是/usr/local/nagios/etc/nrpe.cfg 这份文件,根据服务端的设置来增加参数
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda2]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda1
#command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
command[check_swap]=/usr/local/nagios/libexec/check_swap -a -w 50 -c 30
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda2
command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda5
command[check_tcp]=/usr/local/nagios/libexec/check_tcp -H host145 -p 1521 -c 2 -w 1
command[check_oracle]=/usr/local/nagios/libexec/check_oracle --db olbak
command[check_oracle1]=/usr/local/nagios/libexec/check_oracle --db ORAUP02
command[check_oracle2]=/usr/local/nagios/libexec/check_oracle --db smssite
command[check_oracle3]=/usr/local/nagios/libexec/check_oracle --db jt2
command[check_oracle4]=/usr/local/nagios/libexec/check_oracle --db jt3
command[check_mem]=/usr/local/nagios/libexec/mem.sh -w 10 -c 5
最后需要做的是启动客户端,/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
添加小太阳图标:
1. 下载pnp监控软件:
wget http://jaist.dl.sourceforge.net/project/pnp4nagios/PNP/pnp-0.4.14/pnp-0.4.14.tar.gz
tar zxvf pnp-0.4.14.tar.gz
cd pnp-0.4.14
./configure --with-nagios-user=nagios --with-nagios-group=nagios --with-rrdtool=/usr/local/rrdtool/bin/rrdtool --with-perfdata-dir=/usr/local/nagios/share/perfdata/
make all && make install && make install-config && make install-init && make fullinstall
注:rrdtool的安装目录请区别对待,有时候编译时会报错,那是因为没有安装Hiers
yum install perl-Time-HiRes
部分摘自:http://liuxin1982.blog.chinaunix.net/uid-20527159-id-3484263.html