ODS(Operational Data Store)定義

ODS(Operational Data Store)可操作的數據存儲。

  很多人對ODS究竟是什麼有很多的困惑,ODS對於不同的人可以有不同的看法,我主要說說什麼是最主流的定義。首先我們需要注意,ODS不同於數據倉庫(Data warehouse)或數據集市(Data mart)。數據倉庫是用來保存公司來自很多不同的來源的歷史數據,並主要將這些數據用於趨勢分析,生成報表的地方。它是一個公司很多主題域(subject area)的一個合集,它在企業中是唯一的(一個企業不會有很多個數據倉庫,那樣數據可能會對不上)、真實的(只認可這一個數據倉庫中的數據)。數據集市和數據倉庫扮演的角色一樣,只是數據倉庫包含多個主題域,而數據集市僅僅面向一個主題域。可以把數據倉庫認爲是多個數據集市組合體。

  ODS的目的是集成公司不同來源的企業數據,以便於實時或者接近實時地產生操作報告。通常ODS中數據的結構和源數據結構很像,儘管在數據集成的時候,可以被清理、去規範化, 還有一些數據按照公司政策來集成。這個集成是粒度最小的、一天內發生的頻率最高的集成。通常ODS不會被設計成用來做歷史數據分析或者趨勢分析工作,這些是數據倉庫的功能。ODS通常會被用來當做數據倉庫的數據來源。

 

  總結下ODS和數據倉庫的不同之處:

    ~~ODS用於最低粒度的查詢用,而數據倉庫通常保存的是綜合過的、粒度較粗的數據,通常用於較複雜的、分析性的查詢。

    ~~ODS通常實時性較高,通常保存的數據是實時的或者近乎實時的,因此能較及時地返回查詢請求,數據倉庫通常是歷史的數據,通常分析的數據較多,不能做到實時返回查詢,分析需要比較長時間。

    ~~ODS保存的數據視窗較小,即時間跨度不大;數據倉庫保存的幾乎是一個公司的所有歷史數據。

    ~~ODS爲當前或接近實時數據的操作和戰術決策提供信息,而數據倉庫爲戰略決策提供反饋,從而整體改進系統。

    ~~ODS抽取數據的頻率可以是幾分鐘、幾小時;數據倉庫的抽取數據的頻率可以是每天、每週、每月、或者每季度。

 

  爲什麼需要一個ODS的一些原因:

    ~~源系統能夠提供有限的分析能力

    ~~可以使用更好的、更有效的工具來做分析,而不是直接在源系統上做數據分析

    ~~可以更好地做權限控制,僅僅讓某些人訪問到公司的數據,生成實時或近乎實時的報表統計

    ~~可以將公司不同的數據庫中的數據集合到一起,並基於當天的數據做近乎實時的分析和生成報表

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章