ETL(數據倉庫技術)

ETL

 

(數據倉庫技術)

 

ETL,是英文Extract-Transform-Load的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象並不限於數據倉庫

簡介

 

ETL是將業務系統的數據經過抽取、清洗轉換之後加載到數據倉庫的過程,目的是將企業中的分散、零亂、標準不統一的數據整合到一起,爲企業的決策提供分析依據, ETL是BI(商業智能)項目重要的一個環節。

ETL與ELT

 

ETL所描述的過程,一般常見的作法包含ETL或是ELT(Extract-Load-Transform),並且混合使用。通常愈大量的數據、複雜的轉換邏輯、目的端爲較強運算能力的數據庫,愈偏向使用ELT,以便運用目的端數據庫的平行處理能力。

工具

 

ETL(orELT)的流程可以用任何的編程語言去開發完成,由於ETL是極爲複雜的過程,而手寫程序不易管理,有愈來愈多的企業採用工具協助ETL的開發,並運用其內置的metadata功能來存儲來源與目的的對應(mapping)以及轉換規則。

工具可以提供較強大的連接功能(connectivity)來連接來源端及目的端,開發人員不用去熟悉各種相異的平臺及數據的結構,亦能進行開發。

當然,爲了這些好處,付出的代價便是金錢。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章