OpenNMS簡介

from:http://blog.csdn.net/patronsaint/article/details/5660715

1.1  概述

    Opennms能夠幫助IT管理部門持續的監控分佈式的異構系統和網絡設備的運行狀態,它可以支持SNMP網絡管理協議確保管理的擴展性,並且提供非常靈活的定製功能從而有利於管理範圍的伸縮。它內置的故障事件管理以提供故障事件的記錄和分析的能力,快速隔離非根源事件並迅速發現故障原因。Opennms 良好的設計可以快速部署實施,簡單友好的圖形界面能夠使得用戶迅速掌握,從而降低操作的複雜度,提高IT管理效率。

1.2  體系架構

Opnnms體系架構的介紹:
1.  被管理對象層,SNMP代理程序是數據採集和動作執行層。對應網絡設備來講,該層對應與網絡設備本身的網絡管理功能,不需要在設備上單獨部署功能模塊;對計算機來講,該層是運行在目標計算機上的SNMP服務,負責採集該系統運行狀況、性能等數據,並向管理層彙報。

2.     Opennms監控引擎是實現網絡和系統可用性、故障管理的業務邏輯和策略的處理層。他利用特定的輪詢策略:從代理程序層收集數據、更新和維護被管理對象狀態、執行相關的報警事件通知。

3.     管理對象數據庫是網絡和系統管理的數據存儲層。其中以面向對象的方式保存着網絡和系統資源的模型,記錄着他們的配置、描述和狀態等信息。這些模型和信息是通過Opennms網絡掃描模塊自動建立起來的,並由管理者層自動維護。

4.     圖形用戶界面是網絡和系統管理的數據表示層。他以各種直觀、生動的用戶界面向用戶展示網絡和系統中各種對象的關係、配置、狀態和故障情況,是優秀的用戶接口。



針對某企業簡稱user short name的環境,其IT故障監控子系統的管理框架爲:

1.      被管理對象層——啓動核心路由器和交換機的SNMP網管協議,作爲網絡設備故障的數據提供源;在所有需要管理的服務器上運行SNMP服務,作爲監控操作系統故障的數據提供源。

2.     Opennms網絡監控服務器——新增一臺服務器,部署Opennms的監控引擎模塊,由該模塊對被管理對象層的數據源進行自動的數據採集和翻譯採集的結果。並實時發送報警信息。

3.     對象存儲庫——在和Opennms監控引擎安裝的機器上安裝PostgreSQL,作爲Opennms監控模塊的對象存儲庫。

4.      圖形用戶界面——某企業簡稱user short name管理員可使用任何的WWW瀏覽器連接Opennms網絡監控服務器的用戶界面,使用合適的用戶名,在某種適當的權限下查看和瀏覽網絡監控信息、狀態信息、可用性報表和性能報表。

1.3  功能介紹

1.3.1  網絡節點自動發現


對象存儲庫中的信息並不是靠管理員手工輸入和維護的,而是由Opennms網絡監控引擎-自動掃描模塊自動從用戶的計算機系統中搜索發現出來的。


1.3.2  圖形用戶管理界面

在某企業簡稱user short name這樣的網絡和系統中,需要一些友好的監控視圖。目的是使得管理員能夠通過直觀的界面,迅速發現故障,從而在最短的時間內解決故障。該用戶界面視圖可使得管理員通過管理工具看到現實世界對象的真實反映,而不是抽象的符號。使用戶能夠監控整個系統的概貌,系統的大體分佈和總體運行狀況等。並且決策適當的故障排除方案,各種界面視圖可通過Intranet進行瀏覽查看。


該用戶界面的最左邊是:Nodes with Outages,表格中列出了最近發生故障狀況的12個節點,這些節點可能是網絡故障,或者是某些網絡服務出錯等。

用戶界面的中間是:各種網絡服務的服務水平報告。它列出了最近24小時之內各種網絡服務的服務質量水平;其中的網絡服務可能包括:網絡接口的UP 時間、Web服務、DNS和DHCP服務和數據庫服務等。

最右側的是一些比較常用的功能選項:報警提示信息、節點的性能報表、節點網絡服務相應時間報表和自定義的性能報表。

1.3.3  故障監控

被管理對象的數據採集和狀態維護是由Opennms的監控引擎模塊實現的。每個所管理的所有對象存儲在數據庫中。可以管理的對象包括:

1.      支持SNMP網管的網絡設備

2.      部署了SNMP服務的服務器上的操作系統

Opennms採取統一的通訊方式從這些管理對象上採集可用性和故障信息,信息的採集有兩種方式:

1.      Opennms主動地通過SNMP協議定期查詢被管理對象狀態

2.      Opennms被動接收被管理對象發來的SNMP Trap

Opennms得到被管理對象的輪詢或Trap信息後,根據收到的信息類型、對象原來的狀態和網絡系統管理的策略和邏輯判斷對象的狀態是否發生變化。如果發生了變化,則可以按照管理策略採取若干更新操作。

1.3.4  故障事件管理

當被管理對象的運行狀態發生變化時,就會產生事件。如果該事件是由正常變爲故障,則會產生故障報警。事件管理是通過收集、確認事件,對事件進行分類和過濾,關聯不同來源的事件完成對事件的處理和響應。通過事件管理,系統管理人員可以方便、迅速、及時掌握系統運行的故障和警報,及時進行處理,保障系統的正常、穩定運行。

IT系統管理人員所關注的問題,如系統資源出現短缺、數據庫連接失敗、網絡通信中斷、主機文件系統溢出等等都會以事件的形式表現出來。


1.3.5  操作系統監控

Opennms對各種計算機操作系統的可用性、運行狀況和故障的集中監控是通過本身的SNMP服務程序完成的。這些SNMP代理程序是SNMP服務的組成部分。在本次建議的方案中,在所有的被監控服務器上其監控的主要內容包括:

1.      CPU利用率,顯示系統、用戶、空閒時間的百分比;

2.      虛擬內存(Virtual memory)利用率;

3.     文件系統使用情況,顯示磁盤空間使用情況;

4.      監視文件系統的使用率,當使用率超過特定閾值時向系統管理員報警;

5.      監控網絡端口的輸入、輸出、錯包,以及端口是否被停用或者刪除;

6.     UNIX系統還可以監控

7       Load Average:服務器平均處理量

8.       共享內存

1.3.6  網絡節點配置信息管理

被監控對象節點在數據中的配置信息是IT設備的資產信息,每個網絡節點都是一個特定的IT資產設備。每個節點在數據庫中有很多屬性字段供選擇填寫,主要有三類屬性信息:

1.         配置種類信息:配置分類、告警分類、輪詢屬性和閾值分類。

2.         標識信息:資產描述、廠商、型號、資產編號、操作系統等

3.         位置信息:負責人、部門、樓層、房間、機架編號等


1.3.7  全面的節點監控

每個被監控的節點都能被細緻的記錄和監控。當查看某節點的信息時,有這樣幾類信息:狀態信息、各種網絡服務總的可用性、SNMP屬性、各個接口熟悉、最近發生的5個事件和最近的故障事件。


在查看某個節點是,界面上的信息分爲三類:網絡服務可用性報表、當前狀態和監控事件信息。在菜單欄還能有很多功能選項:查看故障事件、資產信息、響應時間報表、SNMP性能報表、重新掃描、節點管理和更新SNMP信息。


1.4  特點和優勢


Opennms在網絡和系統管理方面,有非常廣泛的用戶,特別是中小企業用戶,Opennms具有很多極好的特點:

1.      方便易用的用戶管理界面——Opennms可以提供故障事件視圖、節點視圖、相應時間視圖、性能視圖等各種管理視圖。

2.      基於Open Source協議開發——用戶可以按照自己的需求,通過修改軟件本身或者軟件的源代碼來定製。

3.      跨平臺管理——Opennms支持任何能運行標準SNMP協議服務的操作系統系統,並且可以從一個單一的用戶界面分別管理其局域網(LAN)。

4.      切實可行的事件管理系統——Opennms通過方便易用的交互式控制檯,爲IT管理員顯示關鍵事件,提供自動的事件響應,可以以電子郵件方式發出事件通知。

5.      方便的集成——Opennms可以與第三方產品集成。例如Opennms可以方便的與Dell、HP、IBM等廠商的服務器自帶的SNMP故障管理軟件集成。

6.      2005 Linux World推薦管理產品 ——Opennms獲得2005年Linux世界大會的“最佳網絡系統管理軟件”的榮譽。已經被認定開源軟件世界中的最佳網絡系統管理軟件。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章