7.23引以爲戒 馬後炮不如加強系統監控

原文地址:http://server.zol.com.cn/242/2422737_all.html#p2422737

馬後炮不如加強系統監控

  “7·23”甬溫線特別重大鐵路交通事故發生已經有十餘天了,國務院事故調查組正在緊鑼密鼓地展開調查事故的原因。7月28日,事故調查組組長、國家安全監管總局局長駱琳在會議上也曾表示,調查結果爭取在9月中旬公佈。在事故原因未能正式調查清楚之前,很業內人士以及媒體都通過分析,提出了自己的觀點。無論,業界分析的原因是否與調查結果相同或想以,有一點是共識我們可以首先提出來:動車運行的安全性仍然需要進一步,遭遇到各種突發事件,我們的應對能力仍然顯得不足。


7.23引以爲戒 馬後炮不如加強系統監控
“7·23”甬溫線特別重大鐵路交通事故示意圖(圖片來自新華網)

    或許這樣的話很多人會說是馬後炮,但是,我們希望通過這個事件,能夠讓我們對自己所處行業的安全問題引以爲戒。

    對於很多企業來說,爲了保證IT系統能夠正常運行,很多企業都有選擇一種系統監控軟件進行實時或者遠程監控。下面,編者蒐集了一些切實可用的系統監控軟件,希望能夠幫助企業IT系統穩定、安全地運行。

  首先,監視系統Nagios。Nagios是一個監視系統運行狀態和網絡信息的監視系統。Nagios能監視所指定的本地或遠程主機以及服務,同時提供異常通知功能等。Nagios可運行在Linux/Unix平臺之上,同時提供一個可選的基於瀏覽器的WEB界面以方便系統管理人員查看網絡狀態,各種系統問題,以及日誌等等。

7.23引以爲戒 馬後炮不如加強系統監控
Nagios所有用戶服務狀況

  具體來看,Nagios的主要功能有:監視網絡服務 (SMTP,POP3,HTTP,NNTP,PING等),監視主機資源(進程,磁盤等),簡單的插件設計可以輕鬆擴展Nagios的監視功能,服務等監視的併發處理,錯誤通知功能(通過email,pager,或其他用戶自定義方法),可指定自定義的事件處理控制器,可選的基於瀏覽器的WEB界面以方便系統管理人員查看網絡狀態,各種系統問題,以及日誌等等,也可以通過手機查看系統監控信息。  

回到頂部閱讀

分佈式監控系統Ganglia

    分佈式監控系統Ganglia

    Ganglia是一個跨平臺可擴展的,高 性能計算系統下的分佈式監控系統,如集羣和網格。它是基於分層設計,它使用廣泛的技術,如XML數據代表,便攜數據傳輸,RRDtool用於數據存儲和可 視化。它利用精心設計的數據結構和算法實現每節點間併發非常低的。它已移植到廣泛的操作系統處理器架構上,目前在世界各地成千上萬的集羣正在使用。它已 被用來連結大學校園和世界各地,可以處理2000節點的規模。


7.23引以爲戒 馬後炮不如加強系統監控
分佈式監控系統Ganglia

  系統監控工具NetXMS

    NetXMS是一款全新的發展迅速的系統監控工具,在GPL2許可下發布。它可用於監測整個IT基礎設施,從支持SNMP的硬件(如交換機路由器)到您的服務器或者是應用程序。NetXMS是一個非常可靠和強大的監測系統,使您提高網絡可用性和服務水平。

  NetXMS具有三層結構,包括信息收集、監測代理(無論是我們自己的高性能的代理或SNMP代理),並送交監測服務器的處理和儲存。網絡管理員可以訪問收集到的數據使用的是Windows爲基礎的管理控制檯,網絡界面或管理控制檯。

7.23引以爲戒 馬後炮不如加強系統監控
系統監控工具NetXMS

  在設計上具有靈活性和可擴展性的考慮,NetXMS內容廣泛的支持平臺,讓你自由選擇平臺。NetXMS服務器的核心繫統目前適用於WindowsNT/2000/2003/XP,Linux,Solaris和FreeBSD的。

    高性能的模塊化監測代理商可爲同一平臺以及爲OpenBSD系統,NetBSD的,的NetWare,HP-UX和AIX操作系統。NetXMS目前支持以下數據庫:MySQL和PostgreSQL數據庫,Microsoft SQL Server和Oracle。由於採用模塊化結構,添加其他數據庫的支持之需要短短几天時間。

  

回到頂部閱讀

輕量級系統監控Conky

    輕量級系統監控Conky

    Conky是一個X系統下的免費的,重量輕,系統監控的,即任何資料都能顯示在您的桌面上。它可運行在Linux和BSD上。

  輕量級系統監控Conky具有的功能包括,(1)很多的操作系統信息(系統名 ,正常運行時間,CPU使用率,內存使用率,磁盤使用情況,進程的統計資料,以及網絡監控等到);(2)基於IMAP和POP3支持;(3)支持許多流行的音樂播放器(XMMS2,BMPx等)。


7.23引以爲戒 馬後炮不如加強系統監控
輕量級系統監控Conky

  自動故障排除和監控的GlassBox

    GlassBox是一個自動故障排除和監控的應用程序,通過一次點擊診斷常見的問題。無論是在生產或測試,你都可以拖放到您現有的Java應用服務器(Tomcat, JBoss, WebSphere, WebLogic)中。它故障排除的知識很簡單,任何人都可以找出失敗的原因。簡單易懂的英語,你不再需要涉及日誌和圖表。

  GlassBox具體包含的功能有,對正在發生的事情捕捉更多的方面(例如,堆棧跟蹤和參數),尤其是異常情況;監測最高級別的資源信息(例如,總共花費的時間,要求服務或連接到數據庫);監測更多的業務,資源,如JMS和EJB組件,XML處理;處理分佈式監測,跟蹤信息,集羣應用及相關資料分發;利用Java 5的管理信息,如CPU的時間或線程的具體統計數字;使用應用服務器JMX統計信息,如線程池;捕捉歷史和趨勢,持久存儲和報告;利用JMX提供警示和揭露統計摘要;自適應發現相關參數跟蹤(例如,未知的數據庫查詢或Servlet的請求)。

7.23引以爲戒 馬後炮不如加強系統監控
自動故障排除和監控的應用程序GlassBox

  爲更高級別的數據庫和服務訪問框架提供資源監測(如Hibernate,TopLink,持久性EJB等);允許不同的數據量抽樣抓獲;監控系統事件,如Web應用程序404錯誤的請求;提供不同程度的統計彙總(例如,直方圖);監測商業活動,如客戶購買或放棄的購物車。

  

回到頂部閱讀

進程守護者Collectd

    進程守護者Collectd

  collectd是一個守護(daemon)進程,用來收集系統性能和提供各種存儲方式來存儲不同值的機制。比如以RRD文件形式。

  當系統運行和存儲信息的時候,Collectd會週期性統計系統的相關統計信息。那些信息可以用來找到當前系統性能瓶頸。(如作爲性能分析 performance analysis)和預測系統未來的load(如能力部署capacity planning).如果你需要美觀的圖形來顯示您的數據,並且已經厭煩了內部解決方案,你找到了正確的地方。


7.23引以爲戒 馬後炮不如加強系統監控
進程守護者Collectd

  一般來說,一圖勝過千言,所以這裏顯示了某個系統在過去60分鐘內的CPU利用率圖形。

  在互聯網上還有其他的免費,開源的項目類似於collectd的項目。爲什麼你要選擇collectd呢?和其他項目相比,我們覺得collectd有一些主要的特點:第一,它完全是由C語言編寫,故性能很高,可移植性好,它允許運行在系統沒有腳本語言支持或者cron daemon的系統上,比如嵌入式系統。

    同時,它包含優化以及處理成百上千種數據集的新特性。collectd包含有超過70多種插件,其中有標準的case到非常特殊和高級的專題。同時,collectd提供強大的網絡聯網特性,它能以多種方式來擴充。最後,collectd開發及時同時文檔支持也是非常好的。

  雖然collectd能夠很大程度滿足您的管理需求,但是它還是存在一些不足:它本身不能生成圖形。雖然它能寫RRD文件,但是它不能從這些文件生成圖形。在contrib/ 目錄下包含簡單的腳本,可以看看kcollectd,一個X window前端和drraw,一個非常通用的解決方案。

     絕世好工具OpenNMS

    OpenNMS是一個企業級基於Java/XML的分佈式網絡和系統監控管理平臺。OpenNMS是你管理網絡的絕好工具,它能夠顯示你網絡中各中終端和服務器的狀態和配置,爲你方便地管理網絡提供有效的信息。

7.23引以爲戒 馬後炮不如加強系統監控
 絕世好工具OpenNMS

  Opsview是一個企業級的網絡、服務器和應用程序監控工具,設計爲可伸縮、靈活和易用的。可跟一些常用的監控系統做集成,例如Nagios Core、Nagvis、Net-SNMP 和RRDTool等。監控服務運行於Linux 和 Solaris 10上,可監控各種系統的服務器,包括Windows。

    開源監控軟件Pandora FMS

  Pandora FMS是一個開源的應用程序,用來監測網站的各種活動。如果一個網站超額或當機,如果網站內容改變,硬盤或CPU被遠程服務調用時(通過SNMP或TCP/IP),以及其它情況。

7.23引以爲戒 馬後炮不如加強系統監控
開源監控軟件Pandora FMS

  Pandora FMS可以運行於任何操作系統, 獲取數據併發送到服務器。你可以收到實時的監測報告,併發送到你指定的郵箱。它也可以通過e-mail,SMS或Jabber(MSN, GTalk等)發到報告。

回到頂部閱讀

開源安全信息管理系統OSSIM

    開源安全信息管理系統OSSIM

    OSSIM即開源安全信息管理系統(OPEN SOURCE SECURITY INFORMATION MANAGEMENT)是目前一個非常流行和完整的開源安全架構體系。OSSIM通過將開源產品進行集成,從而提供一種能夠實現安全監控功能的基礎平臺。 它的目的是提供一種集中式、有組織的,能夠更好地進行監測和顯示的框架式系統。


7.23引以爲戒 馬後炮不如加強系統監控
開源安全信息管理系統OSSIM

  OSSIM明確定位爲一個集成解決方案,其目標並不是要開發一個新的功能,而是利用豐富的、強大的各種程序(包括Snort、Rrd、Nmap、 Nessus以及Ntop等開源系統安全軟件)。在一個保留他們原有功能和作用的開放式架構體系環境下,將他們集成起來。而OSSIM項目的核心工作在於 負責集成和關聯各種產品提供的信息,同時進行相關功能的整合。由於開源項目的優點,這些工具已經是久經考驗,同時也經過全方位測試、可靠的工具。

    監控系統狀態Monitorix工具

     Monitorix是一套可以監控系統狀態的工具,可監控的項目非常得多,你也可以自行設定要監控的服務,預設就可以分析 CPU與記憶體使用率、磁碟存取使用率(Disk I/O Usage)、網絡使用率(Network traffic and usage)、各服務使用需求(network services demand)、使用者登入的狀況等。下面是監控界面截圖:

7.23引以爲戒 馬後炮不如加強系統監控
監控系統狀態Monitorix工具

     監控工具JavaMelody

  JavaMelody能夠監測Java或Java EE應用程序服務器,並以圖表的方式顯示:Java內存和Java CPU使用情況,用戶Session數量,JDBC連接數,和http請求、sql請求、jsp頁面與業務接口方法(EJB3、Spring、 Guice)的執行數量,平均執行時間,錯誤百分比等。圖表可以按天,周,月,年或自定義時間段查看。

7.23引以爲戒 馬後炮不如加強系統監控
監控工具JavaMelody圖表展示

  小結:通過對於以上系統監控軟件的體驗,編者發現這些軟件可以分爲開源軟件,也有企業開發的。同時,它們大多開發了簡單直觀的操作界面,負責對企業TI系統運行情況的監控,也能夠自動報錯。當然,有些軟件因爲是開源的,所以,特定某個功能仍然需要企業用戶自己二次開發。

    有了這些承載企業業務的IT系統運行,可以預防IT系統運行過程中萬無一失。所以,系統監控軟件能夠在一定程度上幫助企業化解日常運行過程中的難題:包括IT系統崩潰,以及一些異常現象等。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章