手淘再推新利器Holmes:一站式智能化異常檢測平臺

指標監控關乎穩定性,但隨着數據量的增加、指標的複雜週期性和模式變化的動態性,基於閾值/同比環比的規則難以適用,而且複雜的領域知識導致爲每條指標配置相應的規則費時費力,無法應用在大規模數據監控上。在監控的有效性方面,傳統的規則報警無法智能識別季節性,也經常受到噪聲/抖動數據的干擾而導致誤報,固定的規則以及閾值更無法進行提前預警。

前言

在上面的背景下,淘系技術質量團隊打造了一款基於AI算法的異常檢測平臺,Holmes是一款智能化、輕量級、易接入、可擴展的異常檢測平臺,使用基於AI的異常檢測算法,替代傳統的規則監控方案。解決規則告警系統準確率低、時效性低、規則配置複雜與耗費人力等諸多問題。

Holmes目前已經在阿里內進行開放,覆蓋淘寶、千牛、優酷、釘釘、淘寶直播等多個應用,核心指標量200+,整體準確率在90%以上,算法調用量高達1000萬餘次,有效進行故障的提前預警20餘次。

平臺理念

Holmes通過AI算法對業務指標進行檢測和預測,從而實現智能化報警,彌補了規則監控的不足,減少誤報和漏報情況。提供一站式的異常檢測服務,滿足時序數據的實時檢測,提供多種接入方式,利用機器學習和深度學習方式,定製化學習模型,有效提升報警覆蓋率,以智能化方式進行穩定性的監控和保障。

原文鏈接:【https://www.infoq.cn/article/up3KKEgtpQeU9xmtbCSk】。未經作者許可,禁止轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章