Hadoop學習筆記一

數據倉庫是決策支持系統(dss)和聯機分析應用數據源的結構化數據環境。數據倉庫研究和解決從數據庫中獲取信息的問題。數據倉庫的特徵在於面向主題、集成性、穩定性和時變性。


ETL是數據倉庫建立的核心過程

ETL:Extract-Transform-Load的縮寫,數據抽取(Extract)、轉換(Transform)、裝載(Load)的過程。


DW:Data Warehousing,根據Bill.Inmon的定義,“數據倉庫是面向主題的、集成的、穩定的、隨時間變化的,主要用於決策支持的數據庫系統”。


Metadata:元數據。描述數據的數據,指在數據倉庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章