原创 用雲壓力測試工具,如何完成一次測試任務

Cloud Performance Test 雲壓力測試平臺(以下簡稱:CPT)可以提供一站式全鏈路雲壓力測試服務,通過分佈式壓力負載機,快速搭建系統高併發運行場景,按需模擬千萬級用戶實時訪問,並結合系統資源狀態,評估系統承載能力,快速定位

原创 運維告警管理—多渠道的通知必達

睿象雲智能告警平臺CA中通知策略實現了被分派人接收告警的通知方式,確保告警發生/認領/關閉時,能以用戶習慣的接收告警的方式,實時收到告警通知,同時,儘可能減少告警遺漏。如果你想實現電話、短信、微信、郵件、APP,5種通知方式,您需要:• 個

原创 如何做到告警的智能降噪?

爲何要壓縮告警?運維監控工具/平臺,一般是通過配置固定閾值,達到閾值後自動觸發/生成告警。如網絡中斷、閃斷;系統升級更新;設備多監控內容多等情況下,更會產生海量告警。以下爲告警管理常見問題:l 故障期間,告警風暴,手機/郵箱會被海量告警淹沒

原创 如何靈活的實現告警的通知?

將告警靈活且準確的通知,能大大減輕運維人員的工作量,使得IT運維人員第一時間解決問題。睿象雲智能告警平臺Cloud Alert(簡稱CA)快速接入各類事件,通過人工智能算法自動發現、診斷、修復IT系統運行事故,並能幫助企業形成最佳事件管理流

原创 快速實現釘釘告警通知、處理告警、關閉告警

釘釘目前已經成爲大多數公司必備的軟件,無論是上下班快速方便的遠程打卡,從而避免了遲到的尷尬局面;還是快速的接收公司第一手消息,從而有效的加快工作的效率。 對於實現告警通知到釘釘羣當中,目前部分主流監控系統可以通過編寫代碼的方式實現,但是通知

原创 Cacti如何實現電話告警

Cacti是一套基於PHP,MySQL,SNMP及RRD Tool開發的網絡流量監測圖形分析工具。Cacti提供了一個快速輪詢器,高級圖表模板,多種數據採集方法和用戶管理功能。所有這一切都被包裝在一個直觀的,易於使用的界面中,這對於局域網以

原创 如何利用排班實現告警的靈活分派?

睿象雲智能告警平臺(Cloud Alert)中的排班管理可以滿足企業內部循環排班需求,使得告警通知給當前時段的分派人,達到告警的靈活分派。排班功能主要有以下的幾部組成: 1.值班人員2.排班週期3.交班時間4.排班時間5.排班生效開始時間

原创 告警信息大爆炸,運維解放祕籍!

信息大爆炸的時代,互聯網企業的運維人員每天都要處理成千上萬的信息。如何處理這種紛繁複雜的情況?面對各種運維事件,想獲得足夠的告警信息,單一的監控系統往往是不夠的。而告警的問題若得不到及時的發現與處理,就很容易收到用戶投訴。 ​ 告警風暴

原创 Zabbix實現電話告警通知的配置方法分享

如果要討論下當下熱門的監控系統,我想zabbix應該能夠佔有自己的一席之地,擁有不小的話語權吧。然而身爲一名苦逼的運維,爲了不錯過重大的告警信息,就需要配置個【電話告警】來進行最快速的通知。zabbix的電話告警通知的方式,在配置的時候總會

原创 Zabbix + Cloud Alert 實踐分享

前言 如果要問老牌開源監控工具泰斗,當zabbix莫屬。之前已分享過 Kubernetes+Promethues+Cloud Alert實踐分享,本篇將繼續分享 Zabbix + Cloud Alert 實踐,在 Zabbix Server

原创 淺談告警管理能力成熟度模型

隨着IT基礎設施的雲化,應用運行環境的容器化,系統架構的微服務化,越來越多的企業不得不引入更多的工具、更復雜的流程和更多的運維人員,來提升IT系統管理的精細度,但新的問題也隨之而來。猶如蝴蝶效應,在如此龐雜的環境下,數據間緊密相連,一個指標

原创 Kubernetes+Promethues+Cloud Alert實踐分享

前言 容器集羣管理系統 Kubernetes(簡稱K8s),爲容器化的應用提供部署運行、容器編排、負載均衡、服務發現和動態伸縮等一系列完整功能,Prometheus 對 K8s 支持非常棒,能夠自動發現 K8s 的監控目標!Promethe