數據倉庫的模型設計流程

數倉模型設計的整體流程涉及需求調研、模型設計、開發測試、模型上線四個主要環節,且規範設計了每個階段的輸出與輸入文檔。

 

  1. 需求調研:收集和理解業務方需求,就特定需求的口徑達成統一,在對需求中涉及到的業務系統或系統模塊所承擔的功能進行梳理後進行表字段級分析,並對數據進行驗證,確保現有數據能夠支持業務需求
  2. 模型設計:根據需求和業務調研結果對模型進行初步歸類,選擇合適的主題域進行模型存放;確定主題後進入數據模型的設計階段,邏輯模型設計過程要考慮總線結構構建、模型規範定義等關鍵問題;物理模型設計以邏輯模型爲基礎,兼顧存儲性能等因素對邏輯模型做的物理化的過程,是邏輯模型的最終物理實現.物理模型在一般情況下與邏輯模型保持一致,模型設計完成後需要進入評審與 Mapping 設計。
  3. 模型開發:就是對模型計算腳本的代碼實現過程,其中包含了數據映射、腳本實現、測試驗證等開發過程。單元測試完成後需要通知業務方一起對模型數據進行業務驗證,對驗證問題做收集,返回驗證模型設計的合理性。
  4. 模型上線:完成驗證後的模型就可以在線上生產環境進行部署。上線後需要爲模型配置監控,及時掌握爲業務提供數據服務的狀況。我們還將模型的實體和屬性說明文檔發佈給倉庫數據的使用者,使模型得到更好地應用。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章