有了 Cloud Alert 電話報警,再也不怕遺漏告警了

Cloud Alert 的部分應用部署在阿里雲上,使用了多方面的監控服務:

  • 阿里自身的ECS服務器和網站。
  • Zabbix 監控服務器應用程序。
  • OneAPM 的應用級監控。
  • 騰訊雲撥測,做網站監控。

騰訊雲和阿里雲的網站監控,總體來說騰訊雲的雲撥測告警延遲大一些。所以我們就強烈要求 Cloud Test 雲測開發網站監控功能,這裏就不打廣告了。

使用過程中存在一些問題:

  • 監控工具多,告警不是很方面集中跟蹤,所以需要集中告警平臺。
  • 漏告警,深更半夜基本上很容易遺漏。阿里雲監控告警僅告一次,不小心就漏了。畢竟不會挨個短信/郵件去跟蹤。

Cloud Alert 自身就是集中告警雲平臺,所以我們自己就把阿里雲告警和其他監控工具的接入進來,並且設置了告警自動升級策略,運維同學(也是開發)配置下短信、微信、電話、郵件通知。

  • 告警集中,目前支持了10多種方式:Zabbix 、Nagios 、Open-Falcon 、阿里雲 、騰訊雲、OneAPM 、監控寶、 vSphere 、 Solarwinds 、 Cacti 等工具。
  • 通知必達,個人和團隊。支持微信、短信、電話、郵件等方式通知到人、如果沒有人處理自動升級,總能找到人。解決漏告警問題。

接入阿里雲監控很簡單:

是通過在阿里雲中配置 Webhook URL 的方式,將阿里雲接入到 Cloud Alert

1、進入 Cloud Alert 中點擊集成-監控工具-阿里雲
在這裏插入圖片描述
2、填寫應用名稱,點擊保存生成 appKey
在這裏插入圖片描述
3、將回調連接填寫到阿里雲控制檯->雲監控->報警服務->報警規則->修改頁面,點擊保存即可。

URL格式
http://api.aiops.com/alert/api/event/aliyun/–/ --處填入您新建應用時生成的appkey

在這裏插入圖片描述

接下來設置下分派策略,這裏設置了2個層次,一線有2人,一個組,以及一個輪流的排班,如果15分鐘沒有處理,會升級到2線。(測試環境)配置參考下方:
在這裏插入圖片描述

最後,設置下自己的通知方法,目前支持微信、短信、電話、郵件,個人偏愛微信,電話是終極利器。界面如下圖。
在這裏插入圖片描述

如果告警被確認就不會繼續發送其他提醒。微信版告警截圖如下:

在這裏插入圖片描述
更多內容參見 Cloud Alert 的技術文檔

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章