實時應用監控平臺--CAT

CAT 簡介

  • CAT 是基於 Java 開發的實時應用監控平臺,爲美團點評提供了全面的實時監控告警服務。
  • CAT 作爲服務端項目基礎組件,提供了 Java, C/C++, Node.js, Python, Go 等多語言客戶端,已經在美團點評的基礎架構中間件框架(MVC框架,RPC框架,數據庫框架,緩存框架等,消息隊列,配置系統等)深度集成,爲美團點評各業務線提供系統豐富的性能指標、健康狀況、實時告警等。
  • CAT 很大的優勢是它是一個實時系統,CAT 大部分系統是分鐘級統計,但是從數據生成到服務端處理結束是秒級別,秒級定義是48分鐘40秒,基本上看到48分鐘38秒數據,整體報表的統計粒度是分鐘級;第二個優勢,監控數據是全量統計,客戶端預計算;鏈路數據是採樣計算。

Cat 產品價值

  • 減少故障發現時間
  • 降低故障定位成本
  • 輔助應用程序優化

Cat 優勢

  • 實時處理:信息的價值會隨時間銳減,尤其是事故處理過程中
  • 全量數據:全量採集指標數據,便於深度分析故障案例
  • 高可用:故障的還原與問題定位,需要高可用監控來支撐
  • 故障容忍:故障不影響業務正常運轉、對業務透明
  • 高吞吐:海量監控數據的收集,需要高吞吐能力做保證
  • 可擴展:支持分佈式、跨 IDC 部署,橫向擴展的監控系統

更新日誌

  • 最新版本特性一覽

    • 注意cat的3.0代碼分支更新都發布在master上,包括最新文檔也都是這個分支

    • 注意文檔請用最新master裏面的代碼文檔作爲標準,一些開源網站上面一些老版本的一些配置包括數據庫等可能遇到不兼容情況,請以master代碼爲準,這份文檔都是美團點評內部同學爲這個版本統一整理彙總。內部同學已經覈對,包括也驗證過,如果遇到一些看不懂,或者模糊的地方,歡迎提交PR。

    • 多語言客戶端:Java、C/C++、Node.js、Python、Go 傳送門

    • 消息採樣聚合

    • 序列化協議升級

    • 全新文件存儲引擎

監控模型:

支持 Transaction、Event、Heartbeat、Metric 四種消息模型。 模型設計

模塊簡介

功能模塊

  • cat-client: 客戶端,上報監控數據
  • cat-consumer: 服務端,收集監控數據進行統計分析,構建豐富的統計報表
  • cat-alarm: 實時告警,提供報表指標的監控告警
  • cat-hadoop: 數據存儲,logview 存儲至 Hdfs
  • cat-home: 管理端,報表展示、配置管理等
  1. 根目錄下 cat-client 模塊以後不再維護,下個大版本更新計劃移除。新版Java客戶端參考:lib/java
  2. 管理端、服務端、告警服務均使用 cat-home 模塊部署即可

其他模塊

  • integration:cat和一些第三方工具集成的內容(此部分一部分是由社區貢獻,一部分官方貢獻)
  • lib:CAT 的客戶端,包括 Java、C/C++、Python、Node.js、Go
  • script:CAT 數據庫腳本

Quick Start

服務端

項目設計

Copyright and License

Apache 2.0 License.

 

更多接入公司,歡迎在 https://github.com/dianping/cat/issues/753 登記

聯繫我們

我們需要知道你對Cat的一些看法以及建議:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章