Nagios監控的原理及工作過程介紹

     Nagios是一款開源的免費網絡監視工具,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網絡設置,打印機等。在系統或服務狀態異常時發出郵件或短信報警,第一時間通知網站運維人員,在狀態恢復後發出正常的郵件或短信通知。
     Nagios是一個監視系統運行狀態和網絡信息的監視系統。Nagios能監視所指定的本地或遠程主機以及服務,同時提供異常通知功能等。
     Nagios可運行在Linux/Unix平臺之上,同時提供一個可選的基於瀏覽器的WEB界面以方便系統管理人員查看網絡狀態,各種系統問題,以及日誌等等。

Nagios 可以監控的功能有:
監控網絡服務(SMTP、POP3、HTTP、PING等);
監控主機資源(處理器負荷、磁盤利用率等);
簡單地插件設計使得用戶可以方便地擴展自己服務的檢測方法;
當服務或主機問題產生與解決時將告警發送給聯繫人(通過EMail、短信、用戶定義方式);
可以定義一些處理程序,使之能夠在服務或者主機發生故障時起到預防作用;
自動的日誌滾動功能;
可選的WEB界面用於查看當前的網絡狀態、通知和故障歷史、日誌文件等;

插件:
     nagios-plugins是nagios官方提供的一套插件程序,nagios監控主機的功能其實都是通過執行插件程序來實現的。
     nagios本身並沒有監控的功能,所有的監控是由插件完成的,插件將監控的結果返回給nagios,nagios分析這些結果以web的方式展現給我們,同時提供相應的報警功能(這個報警的功能也是由插件完成的)。
     所有的這些插件是一些實現特定功能的可執行程序,默認安裝的路徑是/usr/local/nagios/libexec,可以自己查看。

使用NRPE監控LINUX上的”本地信息”

     對系統爲linux的主機進行如下監控:CPU負載、磁盤容量、登陸用戶數、總進程數、殭屍進程數、swap分區使用情況。
     對於像磁盤容量,cpu負載這樣的”本地信息”,nagios只能監測自己所在的主機,而對其他的機器則顯得有點無能爲力。畢竟沒得到被控主機的適當權限是不可能得到這些信息的。爲了解決這個問題,nagios有這樣一個附加組件----NRPE。用它就可以完成對linux類型主機”本地信息”的監控。

NRPE總共由兩部分組成:
       -  check_nrpe 插件,位於在監控主機上
       – NRPE daemon,運行在遠程的linux主機上(通常就是被監控機)

當nagios需要監控某個遠程linux主機的服務或者資源情況,一般過程:
1.nagios會運行check_nrpe這個插件,告訴它要檢查什麼;

2.check_nrpe插件會連接到遠程的NRPE daemon,所用的方式是SSL;

3.NRPE daemon會運行相應的nagios插件來執行檢查;

4.NRPE daemon將檢查的結果返回給check_nrpe插件,插件將其遞交給nagios做處理。

注意:NRPE daemon需要nagios插件安裝在遠程的linux主機上,否則,daemon不能做任何的監控.

通過NRPE的檢測分爲兩種:
       1).直接檢測:檢測的對象是運行NRPE的那臺linux主機的本地資源,原理如下圖
被監控機上安裝有nrpe,並且還有插件,最終的監控是由這些插件來進行的.當監控主機將監控請求發給nrpe後,nrpe調用插件來完成監控.

       2).間接檢測:當運行nagios的監控主機無法訪問到某臺被監控機,但是運行NRPE的機器可以訪問到時,NRPE就可以充當一個代理,將監控請求發送到被監控機(必須要說明的是,通常被監控機與監控機在同一網絡內,所以這樣的情況很少)

Nagios工作原理圖:

wKioL1MEH5qSofFfAAK_8dn_Vlc373.jpg


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章