Data WareHouse Base

                                                                          Data WareHouse Base
                                                   數據倉庫基礎知識

投資計算機系統的目的

    現代化的企業沒有自己的計算機系統是難以想象的。銀行依靠計算機系統實現貨幣電子化,並實現與其他銀行間快速清算,幫助重要客戶實現託付等業務。保險公司依靠計算機系統實現承保、理賠的電子化,並且能夠及時準確瞭解到發生的重大賠案和重要客戶動態。所有已經或準備投資計算機系統的企業,都會部一個問題:“建立計算機系統的最終目的是什麼?”。回答可能多種多樣,但是有一個最主要的目的,也是最終目的肯定是“讓企業賺到更多的錢”。所以,計算機系統是否成功或者是否值得投資,最主要的衡量標準應該是“投資回報”。

成功計算機系統的三個階段

    成功的計算機系統都應該有三個階段“構造基礎設施、優化系統性能、實現信息價值。每個階段有不同的投資回報方式。

    構造基礎設施階段,也就是建立OLTP系統,主要目的是讓大量的事務電子化。比如銀行的通存通兌儲蓄系統,該階段使用權前臺操作人員從繁重的手工操作中解放了出來,並蒐集了大量的原始數據,這些數據對今後企業的發展是一筆寶貴的財富。此階段最大受益人是前臺操作人員。

    優化系統性能階段,其實是保護第一階段投資的行爲。因爲隨着業務系統的運行,系統性能、安全性、可靠性都受到來自各方面的挑戰,優化系統的性能就是解決諸如性能不穩定、系統受非法攻擊等情況,這些情況若得不到及時解決,隨時可能造成災難性後果。此階段最大受益人是計算機系統維護人員;

    實現信息價值,也就是充分利用已有數據,挖掘數據中潛在的信息價值,爲企業決策提供決策上的幫助。所以,此階段最大受益人是決策者。

如何實現信息價值

    幾乎所有行業都面對着激烈的競爭,正確及時的決策是企業生存與發展的最重要環節。越來越多的企業認識到,只有靠充分利用、發掘其現有數據,才能實現更大的效益。日常的業務應用生成了大量的數據,這些數據若用於決策支持則會帶來顯著的附加值。若再加上行爲分析報告、獨立的市場調查、評測結果和顧問評估等外來數據時,上述處理過程產生的效益可進一步增強。數據倉庫正是彙總這些信息的基礎,進而支持數據發掘、多維數據分析等當今尖端技術和傳統的查詢及報表功能。這些對於在當今激烈的競爭中保持領先是至關重要的。調查研究表明,大多數企業並不缺少數據,而是受阻於過量的冗餘數據和數據不一致;而且它們變得越來越難於訪問、管理和用於決策支持;其數據量正以成倍的速度增長。這樣,信息中心面臨着不斷增長的決策支持的需求,但是,開發應用變得越來越複雜和耗費人力。那麼怎樣把大量的數據轉換成可靠的、商用的信息以便於決策支持呢?數據倉庫正廣泛地被公認爲是最好的解決方案。

什麼是數據倉庫

    建立數據倉庫的目的,是把企業的內部數據和外部數據進行有效的集成,爲企業的各層決策、分析人員使用。企業內部數據是指通過業務系統收集到的數據,這些數據可能分佈在不同的硬件、數據庫、網絡環境中,爲不同的業務部門服務。比如對一個製造業用戶來說,可能有生產數據、銷售數據、財務數據、市場數據、人事數據等等,所有這些數據從結構上看,是相對獨立的,是不利於企業決策者進行全面分析和查詢的。如果我們針對決策者的需求,對這引起數據進行結構上的重組,按更方便決策分析的角度去設計,並且充分考慮今後的擴展性與外部數據的接口,會對企業的寶貴資源-數據,實現真正的信息價值。

    對數據倉庫中信息的使用,不同層次的用戶有不同的使用風格。比如:

    主管信息系統(EIS):提供界面豐富,定製容易的決策分析,主要適合企業的高層決策者使用。
    聯機分析處理(OLAP):靈活豐富的多維分析與查詢,可以從不同的角度去分析企業的運作情況,並對未來進行預測。主要適合於企業的中層領導和業務分析人員。
    限席查詢(Ad Hoc Query):提供從多個角度的靈活查詢。適合於業務分析人員。
    靈活報表(Reporting):提供靈活報表的設計。適合於製作報表的人員。

什麼是數據倉庫處理

    數據倉庫不同於數據庫。數據庫是一種通用的平臺,用來管理企業的數據;而數據倉庫是一種概念,在此概念下進行的構造過程,我們叫它數據倉庫處理。所以,數據倉庫不是花錢可以購買的現成產品(而數據庫是),它是一個建立的過程。

    數據倉庫處理包括許多方面的內容,我們可以把它們分成:

    數據準備:
    充分了解決策需求;
    按數據倉庫方法設計數據倉庫結構;
    業務系統數據向數據倉庫結構中進行移動(複製、抽取、清洗…);
    數據倉庫數據向小規模數據集市的數據複製和分佈;

    數據展現:
    面向高層決策者的主管信息系統(EIS);
    面向決策分析者的聯機分析系統(OLAP);
    爲各層決策者服務的即席查詢系統(Ad Hoc);
    爲報表服務的靈活報表系統(Reporting);
    數據展現採用多種靈活的方式,比如客戶/服務器模式或瀏覽器模式。

過程管理

    數據倉庫的建立需要很好的過程管理和方法。我們把數據倉庫的建立作爲過程(Process)來看待,而不是作爲工程(Project)看待。作爲過程看待,主要基於幾方面考慮:

    適應業務發展:企業在市場環境中可能經常需要進行機構、產品、市場的調整,從而導致決策者決策模式的變化。對於數據倉庫的建立過程來說,就是產生了新的需求。

    適應技術的發展:計算機技術發展迅速,新技術不斷出現,如何在數據倉庫建立過程中保證技術不落後,保護原有的技術投資,最佳方式就是採用面向過程的方法:自上而下的總體設計;自下而上的實施。

數據倉庫的投資回報(ROI)

    應用數據倉庫技術,改善企業決策支持模式,並取得最大的投資回報,已經成爲大多數成功企業的共識。具調查,幸福500中已經有85%的企業建成或正在建立數據倉庫,數據倉庫與Internet一樣,正在成爲最快的IT增長點。1996年,全球企業在數據倉庫上的投資達到16.8億美元,並且每年以19.1%的速度增長。據IDC調查,數據倉庫的平均投資回報率在401%。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章