實際運維中處理的事故問題

在IT運維中會遇到的問題

      1、缺乏有效的知識積累和共享,造成操作維護效率低下,類似的故障和問題仍然在不斷髮生,不斷解決着,同時一旦某些掌握關鍵信息和技能的人發生意外狀況(如生病,離職等),整個日常維護可能面臨嚴峻的考驗。

      2、工程師的維護職責不是很清楚,每個人都大概知道自己該做什麼,但是某個具體事情到底該誰負責,卻沒有明細定位。
      3、工程師大多沒有養成記錄習慣,每個月彙總報告時,對自己的工作量、所維護系統的整體情況還是一頭霧水。而且紙質的故障處理報告信息要素不全,統計和查詢都是頭痛的問題。
  4、運維人員幾乎很少能準時下班,處理突發技術故障的事情也時有發生。運維人員往往像“救火隊員”一樣去處理故障。 在“救火式”的IT管理維護模式下,很難有效地進行服務管理,無法保證IT服務的有效性和一致性,IT管理往往處於無序狀態。
  5、對於運維工程師的工作績效缺乏客觀考覈依據。他們到底做了哪些事情?哪些事情還沒有做?工作完成的時效性怎麼樣?解決問題的質量怎麼樣?這些問題,只能憑印象得出一個個模糊的答案。
 
  如何解決以上問題?
 
  如何解決以上提到的問題是目前許多用戶需要解決的問題,但首要關注的問題應是如何建立專業化分工的IT運維體系。
  (1)細化用戶角色,力求提高運維效率
  運維人力分工管理包含人員、崗位、角色等信息,如果這些信息沒有統一規劃,就無法進行統一配置。網絡管理中的角色是根據ITIL標準進行劃分的,是把IT運維各種事情(包括人員、資源、突發事故)分成不同級別和不同運維操作,以便有效的配置運維人力資源。因此,對於企業而言,IT運維的專業化分工本質上是對IT運維人力資源配置的優化。例如,明確運維事件分級處理流程,明確運維人員的職責、權限、義務和績效考覈標準。事實上許多實踐也證明,明確每種運維事件的專業化分工處理流程,可以大大減少IT運維操作的隨意性和混亂性,並能大大提高運維中的人力資源效率。
  (2) 設立IT運維服務檯,規範IT流程
  在網管軟件中,一般提供自助服務和運維服務檯,自助服務檯的作用是,給用戶報故障,評價IT人員解決問題是否負責等。運維服務檯是爲了確定運維等級和引入優先處理原則。運維服務檯主要承擔:運行值班、故障監控、接受請求、工單派發及問題解決過程中的監測等工作內容。服務檯就像是傳統產業生產車間的調度分配員,它會不斷的根據事件的等級進行匹配分工和調度。例如發生任何一個突發運維事件時,服務檯會先檢查並進行分類流轉處理。運維人員可分爲一線普通維護、二線技術專家和三線廠商專家。一線人員作爲第一級問題處理人員,主要解決常規的運維問題;在一線人員不能解決的情況下,二線技術專家將迅速介入問題解決過程;三線技術專家來自產品供應商,由二線技術專家申請三線廠商專家的介入,使問題解決時間能夠大大縮短。
  (3)FAQ和知識庫,最大限度節省人力成本
  提供FAQ和知識庫兩種方式,知識庫是指對IT運維中的典型故障事件和常見問題解答的自助式處理流程。當出現故障時,用戶先在自助式知識庫尋找解決方法。如果問題沒有得到解決,則用戶利用服務檯申請維護,用戶申請將會移交給相應的負責人,負責人第一時間建立服務檔案並一直實時監控,直到問題得到圓滿的解決。因此,自助式知識庫能幫助運維人員節省大量的時間,從而節省人力成本支出。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章