通過cacti+nagios監控服務器的運行--cacti篇

感覺好久沒有寫博文了 做運維的童鞋與軟件打交道的最多的就是監控軟件來,最近學習了nagios監控軟件和cacti監控軟件,由於這兩種監控軟件各有千秋,nagios側重監控報警,cacti側重網絡流量和圖形分析,這裏結合這兩款軟件可以做到兩個軟件的功能並用,在這裏就和大家分享下這兩款軟件結合的好處

實驗環境:RHEL5.5 vmware station 9.0

實驗所需軟件包:cacti+nagios鏡像 下載地址:http://kuai.xunlei.com/d/zxHQAQKLXQCZydRR672

在這裏完成整個實驗效果要需要3臺機器

實驗前:關閉selinux功能 配置IP地址 配置本地源

實驗拓撲圖如下

 image

實驗的開始讓我們先創建一臺虛擬機用來安裝監控服務器,大體配置如下

image

創建完成之後就是掛載鏡像安裝這個操作系統了

下載完鏡像掛載之後開啓電源就會出現如下圖所示

image

選擇要安裝的系統這裏我默認選擇了第一個,選中之後安裝就是全自動了

image

安裝完畢之後選擇Reboot

image

彈出光驅後重啓就可以進入了

有關cacti的介紹請關注百度百科相關介紹

進入cacti的設置

重啓後在瀏覽器中輸入http://192.168.1.1

用戶名是admin 密碼是www.cnyunwei.com

如果想修改密碼的話就選擇【console】-【user management】-【admin】

 image

這裏我們還可以添加一個服務器宕機後的郵件報警功能

console-settings-thresholds

image

修改閾(yu 當初可是好多人都念錯了這個詞的 包括某些老師 哈哈~)值選項中的 要監控的主機地址

image

定義要主機事件通知的郵箱

image

定義閾值顯示的郵件

image 

最後點擊save後完成設置,這樣就可以在cacti宕機後通知郵件主機事件

cacti的監控遠程主機

cacti監控的設備也就是被監控的服務器必須開啓snmp服務在這裏我們直接用yum命令安裝就可以

yum –y install net-snmp

修改配置文件

1 vim /etc/snmp/snmpd.conf

image

這裏要做一個小小的設置

default修改爲192.168.1.1 意思是隻有cacti這臺機器能看到我snmp信息

public爲要設置的密碼 這裏我保持不動密碼還是public

image

2 接着修改以下代碼

image

修改後效果

image

3 image

去掉這一行的註釋讓其生效

image

保存退出後重啓snmp服務

service snmpd restart

添加一臺監控主機

點擊console-device-add

image

點擊後需要設置的地方

image 

主機的描述可以隨便寫

主機名必須寫正確的IP地址或者hostname

主機模板如果是linux主機就選linux主機 如果其他(微軟)就選擇,記得勾上Monitor host這個選項 作用是能在monitor界面上顯示這個主機

image

如果上一步中配置文件還是默認public就不用修改了

點擊create創建

image

如果你上面的snmp設置都做對了的話這裏就會出現這樣的服務器信息,否則會出現error字樣,這時候就該檢查下日誌或者設置哪裏錯誤了

添加監控的內容模板 添加add-save即可

image 

之後再點擊右上方的Create graphs for this host創建需要監控的內容(否則不會出圖)勾選右側需要監控的選項

image

在這裏我監控了所有選中的選項,實際情況可以根據需要選擇監控,之後點擊create創建選擇的監控內容cacti會自動在/var/www/html/rra/保存監控設備的文件

點擊create

image

點擊下方create

image

可以看到創建成功了一系列的監控選項

由於cacti不會立即出監控設備對應的圖像,默認5min後從被監控服務器取信息

過幾分鐘後點擊monitor可以看到server1的監控圖表

image

image

由於監控的東西太多不一一截圖

到這裏再介紹一個cacti的功能

多個cpu合爲一張圖顯示

生產環境中服務器往往都是多cpu多核,而cacti往往都是一個cpu一張圖 這讓我們看不到cpu之間利用率的對比,下面通過cacti整合多個cpu於一張圖中顯示

在這裏爲了方便實驗效果又添加了一個server2的4核服務器

【console】-【Graph Management】-【add】 選擇4核的模板

 image

點擊create

image

選cpu然後點擊下面的save

這時候就能實現整合cpu這個功能了

image 

點擊server2

image

可以看到第一個就是4個cpu整合過的圖,點擊這張圖後

image

cacti能平均1分鐘 5分鐘 30分鐘 2小時 1天分別出監控圖 這對我們分析問題和系統調優是很有幫助的

Thold 閾值報警插件簡介

【console】-templete裏的Threshold templete

image

點擊右上角的add

image

這裏我們創建一個系統進程的進程

image

點擊create

image

image

image

模板創建完成後應該添加需要報警

[console]-new graphs 修改host和graph types,點擊save就可以

image

點擊thold後就可以看到監控的選項

image

點擊修改這個監控選項 然後去掉後點擊save

image

只創建一個有點單調 再創建一個硬盤的監控

創建過程與process大同小異這裏我們直接給出結果

image

可以看到效果圖了現在 如果在創建模板的時候定義了郵件地址 就可以通過郵件報警了

 

PS:第一次用QQ截圖製作的圖片,表示QQ真是人性化到極點,本博文參考運維網製作而成,在這裏要感謝運維網的無私奉獻和隋老大的傾囊相授

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章