概念 : ODS 、數據倉庫

數據倉庫(Data Warehouse

是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策(Decision Making Support)

ODS

是一個面向主題的、集成的、可變的、當前的細節數據集合,用於支持企業對於即時性的、操作性的、集成的全體信息的需求

區別

ods是短期的實時的數據,供產品或者運營人員日常使用,而數據倉庫是供戰略決策使用的數據;ods是可以更新的數據,數據倉庫是基本不更新的反應歷史變化的數據

 

數據倉庫和ODS並存方案

經過調研,發現大體上有三種解法:

1、業務數據 - ODS - 數據倉庫

優點:這樣做的好處是ODS的數據與數據倉庫的數據高度統一;開發成本低,至少開發一次並應用到ODS即可;可見ODS是發揮承上啓下的作用,調研阿里巴巴的數據部門也是這麼實現的。

缺點:數據倉庫需要的所有數據都需要走ODS,那麼ODS的靈活性必然受到影響,甚至不利於擴展、系統的靈活性差

2、OB - ODS

優點:結構簡單。一般的初創數據分析團隊都是類似的結構,比如我們部門就應該歸結到這一範疇

缺點:這樣所有數據都歸結到ODS,長期數據決策分析能力差,軟硬件成本高,模塊劃分不清晰,通用性差

3、數據倉庫和ODS並行

可見這個模型兼顧了上面提高的各自優點,且便於擴展,ODS和數據倉庫各做各的,形成優勢互補!可以解決現在互聯網公司遇到的快速變化、快速開發等特點!特別是對於那些剛剛創建數據團隊,數據開發人員緊缺的公司,可以嘗試使用這個數據架構解決問題!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章