1.zabbix
用戶羣:85%以上的泛互聯網企業。
優點:
• 支持多平臺的企業級分佈式開源監控軟件
• 安裝部署簡單,多種數據採集插件靈活集成
• 功能強大,可實現複雜多條件告警,
• 自帶畫圖功能,得到的數據可以繪成圖形
• 提供多種API接口,支持調用腳本
• 出現問題時可自動遠程執行命令(需對agent設置執行權限)
缺點:
• 項目批量修改不方便
• 社區雖然成熟,但是中文資料相對較少,服務支持有限;
• 入門容易,能實現基礎的監控,但是深層次需求需要非常熟悉Zabbix並進行大量的二次定製開發,難度較大;
• 系統級別報警設置相對比較多,如果不篩選的話報警郵件會很多;並且自定義的項目報警需要自己設置,過程比較繁瑣;
• 缺少數據彙總功能,如無法查看一組服務器平均值,需進行二次開發;
• 數據報表需要特殊二次開發定義;
2.nagios
用戶羣:適合複雜IT環境的企業
優點:
• 出錯的服務器、應用和設備會自動重啓,自動日誌滾動
• 配置靈活,可以自定義shell腳本,通過分佈式監控模式
• 支持以冗餘方式進行主機監控,報警設置多樣
• 命令重新加載配置文件無需打擾Nagios的運行
缺點:
• 事件控制檯功能很弱,插件易用性差
• 對性能、流量等指標的處理不給力
• 看不到歷史數據,只能看到報警事件,很難追查故障原因
• 配置複雜,初學者投入的時間、精力和成本比較大
### 3.open-falcon
Open-falcon是小米運維團隊從互聯網公司的需求出發,根據多年的運維經驗,結合SRE、SA、DEVS的使用經驗和反饋,開發的一套面向互聯網的企業級開源監控產品。
1
![open-falcon](https://i.loli.net/2018/12/20/5c1b0ba1eaa5d.png)
用戶羣:目前有幾十家企業用戶不同程度使用。
優點:
• 自動發現,支持falcon-agent、snmp、支持用戶主動push、用戶自定義插件支持
• 支持每個週期上億次的數據採集、告警判定、歷史數據存儲和查詢
• 高效的portal、支持策略模板、模板繼承和覆蓋、多種告警方式、支持callback調用
• 單機支撐200萬metric的上報、歸檔、存儲
• 採用rrdtool的數據歸檔策略,秒級返回上百個metric一年的歷史數據
• 多維度的數據展示,用戶自定義Screen
• 通過各種插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交換機監控。
缺點:
• 由於發佈時間較短,很多基礎的服務監控插件(如Tomcat、apache等)還不支持,很多功能還在不斷完善中,另外由於缺少專門的支持,雖然有開放社區,但是解決問題的效率相對較低。
4.zenoss![zenoss](https://i.loli.net/2018/12/20/5c1b0bfba7b68.png)
優點:
• Zenoss比較出色的地方在於它的Dashboard,可以配置很多portlet
• 每個用戶的界面都是分開管理的,自定義dashboard不會影響其他用戶
• 強大監控功能支持服務器、路由交換、防火牆、存儲、數據庫、中間件監控
• 採用基於HBASE的opentsdb存儲任意時間段的數據
• 將狀態監控,性能監控,資源管理,良好的報告機制進行有機的整合
缺點:
• 對資源要求較高,即使只管理少數幾臺設備,也需要消耗大量硬件及內存等附加資源。
• 針對windows系統,開源版只提供SNMP,通過WMI檢測CPU,Disk,軟硬件和性能只在收費版提供。
## 商用運維監控系統篇
### 1.監控寶
監控寶是雲智慧爲用戶提供IT性能監控(IT Performance Monitoring)的SaaS產品,包含網站監控、服務器監控、中間件監控、數據庫監控、應用監控、API監控和頁面性能監控等功能。包含免費版、暢享版和企業版,目前用戶約40萬,監控寶app也是國內唯一提供移動監控服務的產品。
用戶羣:覆蓋電子商務、移動互聯網、廣告傳媒、在線遊戲、教育醫療等行業的幾十萬用戶,小米、陌陌、高德、用友、金山、途牛、聚美優品、陸金所、中 國平安、建行信用卡中心、春雨醫生、暢遊、國家電網、中國電信、滴滴打車、春秋航空、鳳凰網等各行業領先企業和中國互聯網百強企業超過30%在使用監控 寶。
優點:
• 作爲國內最早提供基於SaaS服務的網絡監控平臺,監控寶不但爲初級用戶提供免費的標準服務,企業用戶還可以按需購買所需的監控、告警資源,最大限度的節省企業運維成本;
• 監控寶通過遍佈全球的300多個分佈式監測節點,對網絡進行穩定性和可用性的主動監控和實時分析,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等多種協議,測量CDN效果及DNS狀態,全網全地域性能趨勢分析。
• 實 時捕捉服務器深層性能指標,支持Linux/Unix/Windows系統及雲平臺,支持CPU使用率、CPU平均負載、內存使用比例、磁盤IO、磁盤空 間使用率、網絡流量和系統進程數統計等物理指標及30多種應用服務,雲主機監控端一鍵開啓,無需複雜配置。對於應用服務的監控,監控寶已經支持常見的應用 類型包括:Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache和Redis,存儲層監控支持Hadoop、 MySQL、MongoDB、SQLServer、Oracle的健康狀態及性能監控。
• 監 控寶是國內目前唯一支持API監控的網絡監控產品,通過API接口調用模擬用戶使用過程,支持對get、post、put、delete、head、 options六種請求方式進行實時監控;支持JSON、XML、Text、Response Status驗證及Postman腳本導入。
• Docker監控也是監控寶的獨家功能,能夠實時監控Docker容器的CPU、內存、網絡流量及Swap狀態,讓開發者和運維人員在使用Docker時清晰掌握其資源消耗狀況。
• 監控寶提供頁面性能管理,基於國際標準制定頁面性能指數,識別加載元素的狀態及正確性,對全網全用戶加載響應時間分析,同時準確定位問題元素及優化建議。
• 及 時有效的告警通知對運維來說至關重要,監控寶可以根據SLA設置告警閾值,第一時間發送告警通知。監控寶覆蓋最全面的告警通知方式:電子郵件、短信、電話 語音、URL回調通知、App Push等。另外監控寶提供分級告警通知,能夠根據告警事件的不同等級將不同的告警推送給不同的人員,支持企業分層管理!
• 監控寶目前對其Smart Agent進行了開源,用戶可以根據業務需求定製化開發Agent,同時用戶的數據安全得到保障。
• 監控寶提供私有化部署解決方案,滿足政企、金融行業專有網絡監控的需求。
• 來自Compuware、CA、IBM等企業IT服務資深專家,超過5年的本土化企業級SaaS服務經驗,以及超過百人的技術服務團隊,爲用戶提供最佳的服務保障。
### 2.360網站服務監控
用戶羣:個人站長
優點:
• 服務免費,支持網站HTTP監控、PING監控、域名DNS監控和服務器監控
• 提供網站訪問全景數據和簡單配置信息
缺點:
• 只支持簡單的網站和服務器監控,歷史數據保留15天,且免費監控點數量僅爲四個
• 最後一次產品更新是2014年9月,目前已停止更新和運營支持
### 3.阿里雲監控
阿里雲監控是一款免費網站監控產品,可監控站點和服務器,並提供多種告警方式:短信,旺旺,郵件
用戶羣:阿里雲用戶
優點:
• 與阿里雲服務捆綁緊密,允許用戶自定義數據監控
• 阿里雲多IDC間內網數據傳輸,不佔用客戶公網資源
• 支持對業務數據的通用統計,從各個角度反應服務的運行情況
缺點:
• 所有服務基於阿里雲,功能單一,擴展性差
• 功能不夠強大,只能滿足基礎監控需求
### 4.百度雲觀測
百度雲觀測是百度推出的一款雲服務產品,類似於360雲監控、阿里雲監控,主要是爲站長提供免費的一站式網站監測、預警服務,功能覆蓋網站運行狀況、安全和訪問速度等多個方面。
用戶羣:個人站長
優點:
• 對於用戶每日訪問的站點進行安全檢測
• 國內各大城市雲節點覆蓋,支持CDN、DNS狀態和主機監控
缺點:
• 需要進行網站認證
• 監控點少,功能簡單,只能監測網站狀態,不支持服務器、應用監控。
### 5.小蜜蜂網站監測
小蜜蜂網站監測是一款針對中小企業需求開發的綜合測量網站運營情況線上工具,可以定時監控網站或服務器器的可用率(Uptime),一旦網站無法連結、或是服務器發生錯誤,即可發送告警通知。
用戶羣:中小企業網站管理員
優點:
• 小蜜蜂通過探測節點和Last Mile兩種模式監測網站可用性,支持多種站點監控類型和不同的網絡訪問傳輸協議;
• 提供多樣化監控告警設置,並支持站內實時告警消息,支持RSS。
缺點:
• 只支持基本的網站監控,監控點不可選,監控服務不穩定;
• 網站性能歷史數據不夠詳細,且無法導出。
隨 着新技術的不斷髮展,雲服務已經互聯網企業的必須,但是長期以來會存在傳統物理主機和雲主機、私有云和公有云並存的狀態。此外,互聯網企業的發展速度非常 快,小米、滴滴出行等很多企業都是在短短几年內發展起來的,因此選擇一款合適的雲監控產品,伴隨企業同步成長,是非常必要的。