元數據作用

元數據作用

與其說數據倉庫是軟件開發項目,還不如說是系統集成項目,因爲它的主要工作是把所需的數據倉庫工具集成在一起,完成數據的抽取、轉換和加載,OLAP分析和數據挖掘等;元數據在數據倉庫中起到了承上啓下得作用。

具體表現如下:

1.元數據是進行數據集成所必需的

  • 數據倉庫最大的特點就是它的集成性。這一特點不僅體現在它所包含的數據上,還體現在實施數據倉庫項目的過程當中。一方面,從各個數據源中抽取的數據要按照一定的模式存入數據倉庫中,這些數據源與數據倉庫中數據的對應關係及轉換規則都要存儲在元數據知識庫中;另一方面,在數據倉庫項目實施過程中,直接建立數據倉庫往往費時、費力,因此在實踐當中,人們可能會按照統一的數據模型,首先建設數據集市,然後在各個數據集市的基礎上再建設數據倉庫。不過,當數據集市數量增多時很容易形成“蜘蛛網”現象,而元數據管理是解決“蜘蛛網”的關鍵。如果在建立數據集市的過程中,注意了元數據管理,在集成到數據倉庫中時就會比較順利;相反,如果在建設數據集市的過程中忽視了元數據管理,那麼最後的集成過程就會很困難,甚至不可能實現。

2.元數據定義的語義層可以幫助用戶理解數據倉庫中的數據

  • 最終用戶不可能象數據倉庫系統管理員或開發人員那樣熟悉數據庫技術,因此迫切需要有一個“翻譯”,能夠使他們清晰地理解數據倉庫中數據的含意。元數據可以實現業務模型與數據模型之間的映射,因而可以把數據以用戶需要的方式“翻譯”出來,從而幫助最終用戶理解和使用數據。

3.元數據是保證數據質量的關鍵

  • 數據倉庫或數據集市建立好以後,使用者在使用的時候,常常會產生對數據的懷疑。這些懷疑往往是由於底層的數據對於用戶來說是不“透明”的,使用者很自然地對結果產生懷疑。而藉助元數據管理系統,最終的使用者對各個數據的來龍去脈以及數據抽取和轉換的規則都會很方便地得到,這樣他們自然會對數據具有信心;當然也可便捷地發現數據所存在的質量問題。甚至國外有學者還在元數據模型的基礎上引入質量維,從更高的角度上來解決這一問題。

4.元數據可以支持需求變化

  • 隨着信息技術的發展和企業職能的變化,企業的需求也在不斷地改變。如何構造一個隨着需求改變而平滑變化的軟件系統,是軟件工程領域中的一個重要問題。傳統的信息系統往往是通過文檔來適應需求變化,但是僅僅依靠文檔還是遠遠不夠的。成功的元數據管理系統可以把整個業務的工作流、數據流和信息流有效地管理起來,使得系統不依賴特定的開發人員,從而提高系統的可擴展性。
發佈了70 篇原創文章 · 獲贊 57 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章