【技術維新 踐行精彩】+ IBM的IT服務管理產品與企業運維

    當前很多企業都在不同程度的建立了和正在使用着IT服務系統,與此同時也遇到IT服務繁雜但“不給力”,管理較爲混亂,投入與產出不成比例等問題。而內部IT運維人員更是時常扮演着吃力不討好的“救火隊員”的角色。到底如何才能提升服務質量,將IT服務管理得有條不紊並徹底改變運維人員的困境呢?本文從IT服務管理的角度進行深入陳述,通過要點分析,最終結合IBM的相關產品和理念給出了運維管理的實踐參考。

1.服務/運能級別管理

IT部門要實現企業的投資回報率,在服務質量需求、客戶滿意和服務成本之間實現平衡,就必須在任何IT服務的立項階段着手製定服務級別約定(SLA),即:IT服務提供者(IT部門)與用戶之間的約定。其內容包括:IT服務的描述,約定服務次數與時間,響應時間,故障恢復耗時(Recovery Time Objective),故障恢復程度(Recovery Point Objective),用戶和提供者的各自責任,關鍵業務週期,異常處理與升級渠道,以及最終報告等。應當注意的是:對於同一種IT服務,由於總部和分支辦公室的地域差別以及不同部門用戶的角色差異,服務級別約定有時候需要進行定製,以滿足其要求的差異性。此外,IT部門除了有基於服務類型的“總體約定”,還應制定:“特殊區域/部門詳細約定”,例如:對總部寬帶線路的品質保證和特別爲財務部數據安全的保證;以及“特殊用戶羣詳細約定”,例如:對部門經理級別用戶提供移動通信服務的支持力度。因此服務基本約定有利於用戶對IT部門所提供的服務達成共識,避免過高的期望和誤解的產生。IT部門也能籍此作爲服務成本覈算(下面將提到)的基礎。

IT部門與企業其他部門之間可以就IT服務進行約定,從而產生運營級別約定(OLA)。這種約定旨在保證該業務部門的日常運作,例如:保證市場部在外開研討會時所使用IT設備的齊備和可用。此外IT服務上線之前一定要有相應的基礎合同(UC)的支撐,如上網線路保證、硬件備機、軟件技術支持等。此類合同一般由IT管理層與供應商簽訂。

IBM公司早在90年代初期就對IT服務水平管理給予了高度的重視,並始終在這一領域保持着領導者的地位。IBM的服務水平管理軟件IBM Tivoli Service Level Advisor深刻體現了IBM公司在IT服務水平管理方面的思想,是輔助企業進行IT服務水平管理的利器。該軟件可以劃分爲SLM服務器,報告服務器和管理服務器,可以完成包括數據收集,策略規劃,製作報告,服務評價,服務水平升級等各種服務水平管理方面的功能。

2.財務管理

由於企業內部的IT資源是有限的也是有償的,所以企業必須通過全面的成本覈算、預算編制和支付安排等財務管理方法,來了解有多少資源,運營中需要多少資源,以及如何有效的使用這些資源。

2.1.成本覈算

覈算成本有助於瞭解IT 部門在創造其服務價值的同時所付出的成本代價。成本分類歸納爲如下:

1.資本支出:是指固定資產購置或改良成本。如:服務器淘汰更換或網絡系統升級通常屬於資本支出範疇。

2.營運支出:包括維持IT 環境運轉所需開支。如:機房裏的24小時空調。

3.固定成本:是即使未發生任何業務,仍需爲保持企業運營而耗用資金,例如、硬件設備維保和軟件技術支持合同所涉及的款項。

4.變動成本:耗用資金隨資源的使用狀況而成比例變化,如:當配有熱線電話的服務檯資源使用頻率上升時,客戶所需負擔的成本也相應提高。

對於IT相關的服務和資產,可按如下方式進行成本劃分:

1.對於直接被用戶使用的硬件成本,應按客戶數或電腦數量進行分攤。

2.對於軟件成本,應按分配給客戶的許可證數量進行分攤。

3.路由器、交換機等網絡設備,在成本不易按分配計算的情況下,可在企業範圍內按比例分攤到各個部分或區域辦公室。

成本劃分之後,運維人員要分門別類的做相應的開銷記錄,可詳細到什麼部門或誰何時何處使用了/着什麼IT服務,如某個手機號碼通話的逐月詳細清單等。這些開銷最終可錄入至配置管理數據庫中。

2.2.預算編制

編制的預算並非是前期或上年度預算的簡單翻版,而是IT部門協同財務部門通過與實際成本開銷相比對,經過合理性評估,考慮內外部的變化因素,參照各種調價方案,從而修正並體現在新的年度預算中,起到對開銷的合理預測以及IT決策提供參考依據的作用。

2.3.收支管理

收是指IT部門向內部其他部門轉嫁核算出來的部分成本,以實現成本回收。而支是指IT管理層協同財務部門及時安排所有涉及到IT服務的向外支付,以保證企業獲取到不間斷的第三方服務。通過收支管理企業管理層可獲知IT服務的合理花費用途與盈虧。

IBM公司在IT服務財務管理方面提供的產品主要包括Tivoli License Manager和Tivoli Inventory。

3.事件、流程管理

IT日常運維中時常企業裏常存在這樣的現象,某些問題或服務的處理方式和步驟過度的依賴責任人的個人經驗,而無規範的流程可以依據或參考。這樣導致問題處理或服務提供質量的參差不齊、因人而異,更不用說知識或技巧的沉澱與積累了。可見,IT運維最基礎的要素就是要梳理流程,簡單說來就是制定操作中可遵循和複用的步驟。

常見的運維流程包括事件、事故和問題三大類。事件是指某種IT服務或是監控項到達了門限值而發出的警告,以及某種操作所觸發的通知等。比如說:磁盤空間即將耗盡,某個系統補丁完成,對某個用戶登錄密碼的解鎖操作等。事件一般包括信息和警告兩種,信息多來自於系統的自動記錄,因而無需運維人員採取響應。如:應用戶請求通過磁帶恢復了他在某個時間點誤刪的郵件,系統相應的自動留下操作記錄。而警告則是由監控工具在達到某些門限設定值所產生,需要人工干預和調查。如某個實習生突發上傳了大量文件導致網絡磁盤使用率超過90%。事件雖然僅起到告知的作用,但運維人員不可忽視,如不處理,則可能陷入惡性循環,升級成事故和問題。

事故是指計劃外的IT服務中斷或服務質量驟降。如:遠程虛擬桌面服務的中斷導致正在出差用戶無法訪問企業內資源,或者是某用戶在企業內網看在線視頻而拖慢了整體的內、外網訪問速度。事故也包括一些尚未產生影響的配置項(Configuration Items,下面將提到)丟失。如:做鏡像互備的兩個磁盤中的一個損壞,但服務尚未中斷。對於IT人員來說,有時候能夠快速找到那些雖“能治標但不能治本”的事故處理方法可能會比花更多的時間去研究癥結更容易被用戶所接受和認可。

如果說處理事故是利用應急措施儘快恢復IT服務的話,那麼解決問題則是通過查找根源來預防中斷的再次發生,以及對那些實在無法避免的儘量降低其影響的過程。如:通過架設備用線路來防止企業租用的電信網絡突然中斷而導致無法正常繼續業務情況的發生。常見的“80-20原則”在此體現爲:80%IT服務中斷來自於20%的事故或問題。因此對於問題管理可用被/主動相互結合的方式,即:在日常運維階段,被動的對出現的問題查找根本原因並予以解決;而在服務發佈和變更階段,主動並提前設計好可能出現的問題和處理流程以防範於未然,從而體現“磨刀不誤砍柴功”的道理。

各種事件、事故和問題的發現也應做到主/被動相結合。即:由系統自動勘測主動以多種通訊方式告知相關角色人員和由一般用戶或其他IT人員通過Web界面、電話或郵件等方式所被動產生。此處特別值得強調的是Web界面設計上應體現如下特點:

1. 各項條目儘可能的是菜單選擇式,並有默認值。

2. 越容易提交就越會被用戶所頻繁使用,例如僅通過三五步操作便可完成。

3. 爲每一個案子(ticket)都自動設置計時/倒計時,截止時間的功能以方便後期評估。

4. 設置優先級,影響範圍,緊急程度等選項。

5. 預先設置的分類越有條理越豐富,越節約處理人員定位和解決的時間。

6. 設定一些預定義的處理路徑並能準確讀取系統目錄裏IT角色信息,以方便案子的自動流轉和必要時各部門的聯動。

可見,通過設定和規範流程,運維人員的處理步驟和責任顯得更爲清晰。

IBM公司在事件管理和問題管理領域一直保持着巨大優勢,其該領域的拳頭產品IBM Tivoli Enterprise Console (TEC)在業界享有盛譽。TEC通過對IT基礎設施的寬度覆蓋(包括網絡、服務器、應用和安全),能夠實現在一個點上對重要信息的整合。TEC可以進行智能化多級分析和關聯,過濾掉容易使人產生誤解或冗餘的事件,突顯重要信息,指導客戶的支持人員快速準確地把握問題根本原因。它甚至可以根據用戶的定義自動對突發事件作出響應。對於發送到控制檯的重要事件,TEC提供可定製的顯示方式確保用戶的操作員只看到與他們工作相關的事件,幫助他們集中精力處理關鍵的事件,從而使用戶能夠處理最大、最複雜的環境。

4.配置管理

配置管理是涉及到企業“如何使用着”IT服務資源的問題。如果說變更管理則是一個IT服務的由靜轉動的話,那麼配置管理是一個將軟/硬件資產的使用狀態記錄在案的變動爲靜的操作過程。IT服務的配置信息是對於企業的IT日常運作與資產管理起着參考和支撐作用。建立一個配置項數據庫(CMDB)是非常必要的,如果企業的規模較大,在各地有分支機構,則可將配置項數據庫存放在本地並實現冗餘備份和實時同步。該數據庫可包括如下子庫:

1. 最終硬件庫(Definitive Hardware Store),主要是一些IT相關硬件設備的備件和庫存等有形資產的配置和構成的詳細信息,以及它們在實際運行環境中的對應部件信息。

2. 最終軟件庫(Definitive Software Library),主要是各種系統和軟件等無形資產的版本號、許可證、配置項等最終批准版本信息。

3. 文檔庫,主要包括各種操作流程、技術參考文檔、拓撲圖、設備狀態照片等無形資產的信息。

4. IT人員相關,主要包括對各種IT職能角色的定義,組織機構圖,聯繫方式等信息。

數據庫裏存放的是帶有特徵屬性的配置項(CI),並體現着相互依存、調用關係。該遠程登錄系統的範例如下表所示:

條目

內容信息

備註

唯一編號

650099743

系統自動分配

登記時間

201006281543

系統自動分配

類型ID

012502031

01內部服務,25物理上在北京,02軟件庫,031子庫序號

服務名稱

遠程桌面系統

用戶的稱呼

版本號

2008

從屬關係

1. 下轄亞洲,美洲,歐洲三個子系統;

2. 隸屬於綜合遠程服務系統

支持語言

英文/中午/日文/韓文

安裝地點

上海XX區服務器YY

供應商

思傑

服務熱線:800-XXX-XXXX

配置項目歷史

200020032008

超級鏈接可查詢過往信息

連接關係

通過三層交換機(如SHSWL3012401025)的第XX端口連入內網

另附拓撲圖

用途

用戶在離開辦公室內網的情況下,通過互聯網遠程登錄進來,調用內網資源。

IT部門應當強化運維人員及時更新配置管理數據庫的意志,並設置專人定期對配置項等信息進行審覈。

IBM Tivoli Configuration Manager可以幫助客戶全面控制企業的軟件和硬件。它的軟件分發模塊能讓用戶從一箇中心點將複雜的任務關鍵型應用程序快速有效地部署到多個位置。利用Tivoli Configuration Manager,客戶可以跨越企業部署軟件,實現跨平臺、企業級庫存管理。從產品包裝、組織計劃到安排發貨、設備安裝以及總結報告,這款發佈管理軟件提供了針對快速、集中應用部署和管理的一整套工具。它是強化桌面支持技術的強大手段,有助於降低客戶的資產管理成本。

    其實IT運維是一個漫長的過程,運維人員就像球賽時的守門員,即使平時工作做得再好,前89分鐘把門守得滴水不漏,但最後第90分鐘漏了一個球進去、掉了鏈子,則前面一切功勞都被會被用戶所抹殺甚至要追究責任。因此“工欲善其事,必先利其器”,IT部門應選擇好全面易用的IT服務管理工具併合理部署的情況下,將其所提供的各種服務管理得有證可據、有約而循、有責可追、防範於未然,才能讓用戶對服務的評價理性多於感性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章