某500強銀行基於Zabbix高級特性的全棧自動化監控實踐

本文由 dbaplus 社羣授權轉載。

一、Zabbix適合的監控場景

時常會聽到很多運維夥伴在爭論,Prometheus和Zabbix哪一個更好?在我看來,脫離實際應用場景討論技術的優劣其實是沒有任何意義的。

1、監控的維度

在選擇具體的監控平臺之前,我們最先需要明確,我們監控的目標是什麼?在我的理解中,監控分爲兩個維度:即監控的廣度和監控的深度。

1)監控的廣度

大家所需要監控的系統少則幾種,多則幾十種,比如需要監控硬件、存儲、操作系統、中間件、數據庫及應用等。

而在每一個平臺中,又存在多種平臺:比如我們有華爲、戴爾、惠普、IBM的硬件服務器或者交換機,同時也會有Windows、Linux、Aix、ESXi等多種操作系統。

系統和平臺維度的組合,意味着我們不僅僅要監控多個層級的監控,也意味着每個層級內部的需要監控的對象更精細化。因此係統異構性和平臺的多樣性構成了運維的複雜性。

綜上,一個理想的監控平臺應該支持基於各類系統,覆蓋各類廠商和平臺的監控。

2)監控的深度

相對的,監控目標需要考慮的另一維度是監控的深度。就監控深度而言,我們可以將其簡單分成可用性監控、性能監控、日誌監控和自定義監控這四大類。

  • 可用性監控: 它的狀態是一個布爾型,即只有1或者0。比方說,一個服務是處於停止狀態還是運行狀態,一個端口是up還是down,根據可用性監控我們可以獲知監控對象是否處於正常狀態;
  • 性能監控: 是基於可用性監控的更進一步監控。比如說我們監控某個ip地址,在可用性監控中我們會去ping這個ip。如果通,就說明這個ip可達;更進一步,ping延遲就是這個ip的性能監控。通過性能監控,我們可以獲知監控對象的健康程度以及負載水平。CPU、內存使用率,磁盤的IOPS,網絡的吞吐量,都是常見的性能監控指標;
  • 日誌監控: 不管是可用性監控還是性能監控,都基於一定的輪詢週期進行採樣,在兩個採樣點之間的監控其實是缺失的,因此在兩個採樣點之間可能會遺漏一些異常監控數據。通過日誌監控,可以記錄下每一個操作或者行爲,確保監控的完整性。常用的日誌監控會分爲安全日誌、系統日誌、應用日誌和操作日誌等;
  • 自定義的監控: 顧名思義,根據我們自身的情況去定義一些符合我們監控需求的監控指標。比如訂單數、網絡設備流量的聚合運算等等。

原文鏈接:【https://www.infoq.cn/article/ASsqbqfarrwv3PgVHK0J】。未經作者許可,禁止轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章