您所知道的IT運維管理

網絡規模的發展和擴大,使得應用產品技術日漸多樣和複雜,越來越多的企事業單位的生產業務和日常工作將實現信息化,並通過提高信息化水平實現對內提高經營水平、對外提高服務水平的目的。各企業業務的展開越來越依賴IT系統的正常運轉,生產業務日漸依賴IT部門提供的系統服務,IT部門正由“成本中心”轉變爲“服務中心”、“效益中心”。
隨之而來的問題是IT部門將如何通過管理爲企業提供更好的、可度量的、符合業務需求的服務?同時,這些服務需要能夠適應業務需求以及新技術帶來的影響,爲新業務系統的運行提供支撐,讓IT運維管理成爲企業成長的助力。
何謂IT運維管理?在瞭解這個概念之前,我們首先需要了解一下什麼是IT管理?
IT管理是在信息化運營階段通過運維管理制度的規範,IT管理系統工具的支持,引導和輔助IT管理人員對各種IT資源進行有效的監控和管理,保證整個IT系統穩定、可靠和永續運行,爲業務部門提供優質的IT服務,以較低的IT運營成本追求業務部門較高的滿意度。
簡而言之,可以理解IT運維管理爲:在網絡的基礎設施建設完成之後,整個網絡處於運行狀態,IT部門採用相關的管理方法,對運行環境(包括物理網絡,軟硬件環境等)、業務系統等進行維護管理,我們把這種IT管理的工作簡稱爲IT運維管理。
 
IT運維管理包含內容
IT運維是IT管理的核心和重點部分,也是內容最多、最繁雜的部分,主要用於IT部門內部日常運營管理,涉及的對象分成兩大部分,即IT業務系統和運維人員。其管理內容又可細分爲七個子系統:
    第一、設備管理:對網絡設備、服務器設備、操作系統運行狀況進行監控,對各種應用支持軟件如數據庫、中間件、羣件以及各種通用或特定服務的監控管理,如郵件系統、DNSWeb等的監控與管理;
    第二、數據/存儲/容災管理:對系統和業務數據進行統一存儲、備份和恢復;
    第三、業務管理:包含對企業自身核心業務系統運行情況的監控與管理,對於業務的管理,主要關注該業務系統的CSF(關鍵成功因素Critical Success Factors)和KPI(關鍵績效指標Key Performance Indicators);
    第四、目錄/內容管理:該部分主要對於企業需要統一發布或因人定製的內容管理和對公共信息的管理;
    第五、資源資產管理:管理企業中各IT系統的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的,並能夠與企業的財務部門進行數據交互;
    第六、信息安全管理:該部分包含了許多方面的內容,目前信息安全管理主要依據的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業安全組織方式、資產分類與控制、人員安全、物理與環境安全、通信與運營安全、訪問控制、業務連續性管理等;
    第七、日常工作管理:該部分主要用於規範和明確運維人員的崗位職責和工作安排、提供績效考覈量化依據、提供解決經驗與知識的積累與共享手段IT運行維護管理的每一個子系統中都包含着十分豐富的內容,實現完善的IT運維管理是企業提高經營水平和服務水平的關鍵。
 
IT運維管理面臨的難題
IT運維管理是一門探討如何提高網絡應用性能的課題,怎樣利用網絡管理做到企業IT基礎設施建設的管理、合理分配網絡資源、保障生產業務、對網絡規劃和新業務上馬提供支撐,而其最核心的目的是保障企業生產業務。
日常IT運維管理面臨諸多難題,具體體現在以下多個方面:
網絡設備
在企業IT基礎設施的搭建過程中,底層的網絡設備廠商和類型多樣且複雜。隨之而來的問題是:如何將不同廠商的網絡和應用管理產品在界面級、消息級和數據級集成起來實現統一管理?如何讓IT管理員瞭解到整個網絡全局的運行情況、發展趨勢和可能存在的故障隱患點,以便及時採取相應措施,實現事前管理。
拿北塔軟件曾經碰到過的一個典型客戶來說,它的網絡中有11種廠商的路由交換設備,還有存儲設備,安全設備,UPS等。同時還擁有:小型機,服務器等,上層的業務系統有OACRM等。這樣大而複雜的一個網絡環境,該怎麼管呢?
科學的運維管理思路告訴我們,首先需要解決的是對IT基礎設施的管理,管理範圍要能覆蓋到機房所有硬件設備。這一點是前提和基礎。其次,纔是對各種應用系統做到很好的監控。最後,才能爲業務系統提供足夠的保障。
網絡流量
在絕大多數的企業網絡中,存在不同程度的網絡延遲,造成重要業務和應用時斷時續,這直接成爲企業業務的殺手。另外,網絡的帶寬也是企業關心的重點。比如,哪個時間段很擁擠,哪個時間段很空閒,有沒有規律,怎麼樣去調查擁塞的原因,網絡帶寬都是被誰佔用了,是被哪些客戶端、哪些應用或者異常應用所佔用了。這些都是擺在每一個企業運維管理領域中很實際的問題。
該如何很好的解決這些問題呢?
根據多年的運維管理經驗得出,對於這種情況,需要採用流量分析的方式。通過對出口流量或者監控對象進行採集,進行24小時實時的監控和分析,可以對流量進行多角度多層次的挖掘分析,比如按照流量、數據包個數、連接數、協議等類別分析當前網絡的負載情況,爲網絡的優化配置提供參考。通過報表分析展現流量特徵,讓IT管理員明白流量被誰、被何種應用、被何種異常行爲佔用得怎麼樣。
IT運維管理怎麼樣幫助IT管理員判斷和控制安全問題,也就是作爲與防病毒、防火牆、IPS等安全產品不同的角色,從網絡的整體情況要能夠判斷未知的安全問題,並提供修復方案,在不影響正常網絡運行狀況下將安全問題防患於未然。如果IT管理員能針對異常行爲的特徵建立自動告警,在某些安全攻擊出現前發現故障隱患,並提供連動的判斷和處理機制,這樣IT管理員可以及時採取了措施避免業務遭受損失。如果能在對問題特徵自動告警的同時,自動記錄問題的原始數據以供事後分析,這樣IT管理員可以再現數據異常行爲、捕捉網絡數據異動入侵記錄,對症下藥制訂策略防止問題的再次發生。
 
業務系統
針對日益複雜的業務系統,現有的運維管理系統更多的強調的是功能的展現。比如,從業務主機負載、數據庫服務器負載、數據庫、中間件、應用系統、網際流量、進程狀況等等不同角度實施聯合監控,強調的是性能參數指標的多少,或者是界面的美觀程度。當然,這是落實業務系統管理環節所採用的方法。
但事實上,作爲企業自身來說,無論採用哪種監控也好,IT管理手段或者運維管理系統也罷,其核心總是需要圍繞保障和改進企業的業務系統。
這就提出一個問題,如何來保障又如何改進企業的業務系統呢?
首先,需要了解清楚業務系統所涉及的具體環節,針對每一個環節進行管理落實。按照科學運維管理的建設思路,分爲:用戶—網絡—硬平臺—軟平臺—業務系統這五個環節。需要從這五個環節所涉及到的五個方面去做工作。這五個方面分別是:全局的性能管理、故障和事件管理、資源的使用狀況管理、安全管理和數據分析管理。其次,通過性能和歷史數據的反映,又可以做到對業務系統提供改進決策的指導。
當然,對於如何保障和改進業務系統這個問題,目前業界衆說紛紜,沒有統一的標準。但有一點是肯定的,就是需要從企業用戶的角度出發,通過明確的管理思路作爲指引,使用軟件+服務的方式和企業用戶共同探索和研究,最終達到對業務的保障和改進。
 
當前IT運維管理的任務
在企業網絡運維早期,IT運維管理側重於網絡、硬件等設備。隨着業務系統涉及的環節日益增多,單一的網絡管理已經不足以滿足管理需求,越來越多的企業已經將關注點從單一網絡轉變到當前的業務系統,落實保障業務系統的各個環節成爲重中之重。
因此,北塔軟件認爲,當前國內用戶最關心的莫過於如何保障業務系統的正常運行。IT運維繫統應該從業務角度切入,以業務爲導向,通過對整個業務系統的關注,落實業務系統的各個環節,從而來達到保證業務系統穩定運行和透明化管理的目的。

本文出自 “老孫的網絡管理” 博客 http://sunyongjie.blog.51cto.com/445592/117873

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章