DB2的數據倉庫

數據倉庫


包含運作數據(運行業務日常交易的數據)的系統包含了業務分析員可用來更好地理解業務是如何運作的信息。例如,他們可以看到一年中的哪些時候在哪些地區銷售了哪些產品。這有助於識別異常情況,或者規劃未來的銷售。

但是,如果分析員直接訪問運作數據,那麼會產生幾個問題:

  • 他們可能沒有查詢運作數據庫的專門知識。例如,查詢 IMS 數據庫需要一個使用專門類型的數據操作語言的應用程序。一般而言,那些擁有查詢運作數據庫專門技術的程序員都全職維護數據庫及其應用程序。

  • 性能對於許多運作數據庫(例如銀行的數據庫)是關鍵。系統無法處理用戶對運作數據存儲所進行的“特別的”查詢。想象一下您正在因特網上處理您的銀行業務並支付帳單。當您按下 OK 按鈕時,處理付款通常只要幾秒鐘。現在,請考慮銀行分析員正在設法搞清楚如何從現有的客戶羣賺取更多的錢。該分析員運行了一個查詢,它非常複雜,以致於現在完成您的事務要花大約 30 秒時間。很顯然,這個性能時間是不能接受的(而且分析員所幻想的新費用也是不可能的)。由於這個原因,一般將運作數據存儲和報告數據存儲(包括 OLAP 數據庫)分開。

    但是,在近幾年中,報告數據存儲已經逐漸成爲僞操作(pseudo-operational)數據存儲而且很流行。這樣的存儲稱爲操作數據存儲(operation data store)(ODS)。例如,請考慮電信業。ODS 在這些公司中很流行,因爲它們儘可能快地設法識別欺騙性的費用。DB2 是非常適合於運作和報告工作負載的少數幾個數據庫之一。

  • 運作數據通常並不是業務分析員使用的最佳格式。例如,對於分析員來說,根據產品、地區和季節而彙總的銷售數據比原始數據有用得多。

數據倉庫解決了這些問題。在數據倉庫中,您創建信息化的數據(informational data)(該數據抽取自運作數據,隨後對其進行轉換和清理,以用於最終用戶的決策)存儲。例如,數據倉庫工具可能會複製運作數據庫中的所有銷售數據、執行計算以彙總數據以及將彙總好的數據寫到與運作數據分開的數據庫。最終用戶可以查詢這個分開的數據庫(數據倉庫),而不會影響運作數據庫。

發佈了22 篇原創文章 · 獲贊 0 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章