Nagios 工作涉及到日常的操作

由于工作中会有日常的操作,闲暇时间写出来可能对大家有帮助,如果没有帮助,请略过1.Nagios添加、删除监控节点

2.Nagios服务的添加删除

3定义报警通知联系人,以及发送报警方式

4.定义报警邮件的接受方式、

 

1.1.Nagios添加、删除监控节点,首先要确定group(WEB页面查询,客户邮件要求),之后,连接机器,进入后sudo su - 切换到管理员,打开指定目录group文件,vi d打开/usr/local/nagios/etc/cfgs/dc/infra.cfg,infra.cfg文件下面你会看到很多define host{} 这是nagios定义监控点和服务的格式,{}之间的内容是根据用户的需求可以调整的,一般情况下按照有的内容定义新的监控点就可以了,我截取了一个host 具体说明下:

define host{

use dc-linux-host                  nagios已经定义好的内 容,直接引用

host_name nagios02.pek.dc          主机名

alias nagios02.pek.dc              别 名

address 10.219.*.*                  主机的IP地址

check_command check-host-alive      nagios定义好的命令,命令的意思是对被监控主机发送ICMP包来监测被监控主机是否存活。

contact_groups RS_NOC,dc_server     接收报警通知组

}

保存退出,check

Checking for circular paths between hosts...

Checking for circular host and service dependencies...

Checking global event handlers...

Checking obsessive compulsive processor commands...

Checking misc settings...

Total Warnings: 0

Total Errors: 0

Things look okay - No serious problems were detected during the pre-flight check

显示errors:0 就OK啦,之后 /etc/init.d/nagios reload 完成添加,可以到web页面下找到你刚才添加的监控主机。

2.如何添加监控服务

比如添加DNS tcp53 端口监测、CPU、disk 等等 很多

与刚才一样 vi 编辑 infra.cfg下 (VI 下复制多行 NYY+P   N=行数 YY=复制  p=粘贴)

define service{

use                            dc-generlic-srvice,srv-pnp           nagios定义好,直接引用

host name                 nagios01.pek.dc                              主机名

service_descrption    CPU—per—p1          nagios显示的服务名称

check_command     check_nrpe+!check_cpu_per_dc!90!95   监测CPU使用率 报警伐值设置为90  warning 和95告知联系组 ,伐值是客户需求,可以根据要求更改。

contact_groups            RS_NOC,dc_server      报警通知组

}

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章