元數據是幫助用戶和技術人員對數據倉庫裏的數據理解,可以分爲技術元數據和業務元數據。
技術元數據包含:
1:模型定義
定義數據倉庫裏各各種模型的功能,包括數據的口徑,各個字段的含義,使用範圍,出數時間和頻率。
2:血緣定義
模型裏的源頭數據來源,ETL同步方式,時間,頻率,各個系統和表的上下游關係。
3:ODS定義
模型裏的源頭表的源系統名稱,技術負責人,源頭表數據邏輯,數據更新方式。
4:權限管理
管理數據倉庫平臺上的業務人員和技術人員的數據權限,可以分爲庫的權限,表的權限,模型數據權限。制定相關流程,方便平臺用戶申請使用和業務owner審批。
業務元數據包含
主要是提供用戶在使用數據時能理解數據的含義,在碰到疑問時,可以找到相關業務部門瞭解數據的口徑和使用場景,讓數據有業務部門的owner,有了業務部門背書,此數據就是公司統一出來的口徑,官方的說明。
更多技術文章請關注公衆號(長按後點識別圖中二維碼):