Gartner | 做到卓越AIOps智能運維的12步

Gartner於2017年底提出了做到卓越智能運維的12個步驟。本文爲華青融天對該文章< 12 Steps to Artificial Intelligence for IT Operations Excellence >的整理和翻譯,現將內容進行分享,希望大家能夠有所收穫。


目前許多部署AIOps技術的企業(大約60%)希望在短期內實現兩個目標:

  1. 獲得整個IT產業中的事件和行爲的概要視圖;
  2. 對未來可能發生的事件有所瞭解。

但是,這兩個目標通常需要一段時間的準備階段。在準備過程中,企業要充分學習使用AIOps平臺所需的獨特技能,並在有限的使用案例中“實踐”。

在下文中,Gartner提出了I&O(基礎設施與運維)領導者應該鼓勵他的IT運營團隊遵循的12個步驟,通過AIOps來建立一個企業基礎架構和應用程序組合的端到端的、面向未來的視圖。 這12個步驟的持續進展現在需要大約兩年時間。隨着IT運營專業人員數據科學技能的提升,這個過程可能會縮短到一年到18個月。

這12個步驟自然分爲四個主要階段:初創階段,被動響應階段,主動階段和擴張階段。
卓越智能運維的12個步驟

初創階段

Gartner發現企業經常會從基於大量數據的項目來開始他們的AIOps工作,希望能夠快速地整合出一個系統行爲的端到端視圖。 然而,大多數IT運營團隊沒有理解和操作大型數據集所需的技能。因此,在初創階段,I&O領導應該:

  1. 選擇一到三個業務應用程序作爲測試用例。
  2. 對運維人員的教育和過往履歷進行審查,重點關注用於統計分析和複雜模式識別的知識。
  3. 通過普查與運維和開發過程中的應用有關的工具以及相關的日誌文件,API和社交媒體,清點能夠產生應用程序信息的現有數據源。
    AIOps平臺的邏輯結構

被動響應階段

AIOps平臺能夠處理兩種不同的數據:存儲的歷史數據和實時顯示給觀測者的流數據。在學習如何應對複雜龐大的數據量時,Gartner發現從歷史數據開始會更容易一些。相反,IT運維團隊應該通過使用可視化軟件並進行集體性的統計分析來提高分析能力。在這個階段獲得的大部分信息將是回顧性的。因此,在這個階段, I&O領導應該:

  1. 通過部署通用key-object數據庫管理平臺(如Hadoop或Cassandra)或存儲指標和數字或文本字符串的日誌管理平臺來構建半結構化的AIOps歷史數據庫。
  2. 通過使用豐富的自然語言和可視化功能以及Tableaux和Graphite等工具覆蓋AIOps歷史數據庫中包含的數據,從而提供數據的廣泛權限訪問。
  3. 通過部署統計分析或技術計算軟件,與從歷史數據庫提取的數據結合使用,提供聚類,聚合和展示歷史數據趨勢的方法。

主動階段

掌握了歷史數據和人工分析後,IT運營團隊能夠轉向流數據和實際AI功能的引入。 值得注意的是,相較於未來事件預測,自動異常檢測和根本原因分析能夠爲企業實現更多價值。在主動階段的三個步驟之中,I&O領導應該:

  1. 將性能,事件,API和社交媒體數據流式傳輸到相同的訪問、可視化和統計分析軟件上,並確保訪問,可視化和分析可以同時應用於歷史數據和流數據,在此基礎上引入實時分析功能。
  2. 通過部署面向關聯的機器學習軟件並將其應用於歷史和流數據源,預測應用程序性能事件和行爲。
  3. 通過將因果路徑提取系統應用於之前在訪問,可視化,分析和自動關聯確定軟件的幫助下進行發現的模式,從而對應用程序性能問題或行爲異常進行根本原因分析。

擴張階段

AIOps功能爲IT運維,其他IT元素(如開發和安全)以及最重要的數字業務的核心任務提供了重要接口。隨着業務流程的數字化,業務事件越來越多地與IT系統交叉,並在流入並存儲在AIOps平臺中的數據中留下它們的痕跡。 因此,在擴張階段的三個步驟中,I&O領導應該:

  1. 通過從大約20個生產中的關鍵業務應用程序中提取數據到AIOps平臺,擴大AIOps覆蓋範圍。
  2. 通過在平臺及其關聯的流程和開發,安全性,配置,更改,問題和事件管理技術和流程之間部署雙向鏈接,將AIOps功能轉換爲跨IT服務。
  3. 通過在平臺及其相關流程和數字業務流程分析技術和流程之間部署雙向鏈接,將AIOps功能轉換爲跨數字業務服務。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章