通过cacti+nagios监控服务器的运行--cacti篇

感觉好久没有写博文了 做运维的童鞋与软件打交道的最多的就是监控软件来,最近学习了nagios监控软件和cacti监控软件,由于这两种监控软件各有千秋,nagios侧重监控报警,cacti侧重网络流量和图形分析,这里结合这两款软件可以做到两个软件的功能并用,在这里就和大家分享下这两款软件结合的好处

实验环境:RHEL5.5 vmware station 9.0

实验所需软件包:cacti+nagios镜像 下载地址:http://kuai.xunlei.com/d/zxHQAQKLXQCZydRR672

在这里完成整个实验效果要需要3台机器

实验前:关闭selinux功能 配置IP地址 配置本地源

实验拓扑图如下

 image

实验的开始让我们先创建一台虚拟机用来安装监控服务器,大体配置如下

image

创建完成之后就是挂载镜像安装这个操作系统了

下载完镜像挂载之后开启电源就会出现如下图所示

image

选择要安装的系统这里我默认选择了第一个,选中之后安装就是全自动了

image

安装完毕之后选择Reboot

image

弹出光驱后重启就可以进入了

有关cacti的介绍请关注百度百科相关介绍

进入cacti的设置

重启后在浏览器中输入http://192.168.1.1

用户名是admin 密码是www.cnyunwei.com

如果想修改密码的话就选择【console】-【user management】-【admin】

 image

这里我们还可以添加一个服务器宕机后的邮件报警功能

console-settings-thresholds

image

修改阈(yu 当初可是好多人都念错了这个词的 包括某些老师 哈哈~)值选项中的 要监控的主机地址

image

定义要主机事件通知的邮箱

image

定义阈值显示的邮件

image 

最后点击save后完成设置,这样就可以在cacti宕机后通知邮件主机事件

cacti的监控远程主机

cacti监控的设备也就是被监控的服务器必须开启snmp服务在这里我们直接用yum命令安装就可以

yum –y install net-snmp

修改配置文件

1 vim /etc/snmp/snmpd.conf

image

这里要做一个小小的设置

default修改为192.168.1.1 意思是只有cacti这台机器能看到我snmp信息

public为要设置的密码 这里我保持不动密码还是public

image

2 接着修改以下代码

image

修改后效果

image

3 image

去掉这一行的注释让其生效

image

保存退出后重启snmp服务

service snmpd restart

添加一台监控主机

点击console-device-add

image

点击后需要设置的地方

image 

主机的描述可以随便写

主机名必须写正确的IP地址或者hostname

主机模板如果是linux主机就选linux主机 如果其他(微软)就选择,记得勾上Monitor host这个选项 作用是能在monitor界面上显示这个主机

image

如果上一步中配置文件还是默认public就不用修改了

点击create创建

image

如果你上面的snmp设置都做对了的话这里就会出现这样的服务器信息,否则会出现error字样,这时候就该检查下日志或者设置哪里错误了

添加监控的内容模板 添加add-save即可

image 

之后再点击右上方的Create graphs for this host创建需要监控的内容(否则不会出图)勾选右侧需要监控的选项

image

在这里我监控了所有选中的选项,实际情况可以根据需要选择监控,之后点击create创建选择的监控内容cacti会自动在/var/www/html/rra/保存监控设备的文件

点击create

image

点击下方create

image

可以看到创建成功了一系列的监控选项

由于cacti不会立即出监控设备对应的图像,默认5min后从被监控服务器取信息

过几分钟后点击monitor可以看到server1的监控图表

image

image

由于监控的东西太多不一一截图

到这里再介绍一个cacti的功能

多个cpu合为一张图显示

生产环境中服务器往往都是多cpu多核,而cacti往往都是一个cpu一张图 这让我们看不到cpu之间利用率的对比,下面通过cacti整合多个cpu于一张图中显示

在这里为了方便实验效果又添加了一个server2的4核服务器

【console】-【Graph Management】-【add】 选择4核的模板

 image

点击create

image

选cpu然后点击下面的save

这时候就能实现整合cpu这个功能了

image 

点击server2

image

可以看到第一个就是4个cpu整合过的图,点击这张图后

image

cacti能平均1分钟 5分钟 30分钟 2小时 1天分别出监控图 这对我们分析问题和系统调优是很有帮助的

Thold 阈值报警插件简介

【console】-templete里的Threshold templete

image

点击右上角的add

image

这里我们创建一个系统进程的进程

image

点击create

image

image

image

模板创建完成后应该添加需要报警

[console]-new graphs 修改host和graph types,点击save就可以

image

点击thold后就可以看到监控的选项

image

点击修改这个监控选项 然后去掉后点击save

image

只创建一个有点单调 再创建一个硬盘的监控

创建过程与process大同小异这里我们直接给出结果

image

可以看到效果图了现在 如果在创建模板的时候定义了邮件地址 就可以通过邮件报警了

 

PS:第一次用QQ截图制作的图片,表示QQ真是人性化到极点,本博文参考运维网制作而成,在这里要感谢运维网的无私奉献和隋老大的倾囊相授

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章