Oracle Data Integrator 學習一

Oracle Data Integrator

ODI(Oracle Data Integrator)是Oracle在2006年10月收購Sunopsis公司後,整合Sunopsis Active Integration Platform而推出的一款數據集成工具,現在是Oracle Fusion Middleware的組件。和Oracle自己的OWB(Oracle Warehouse Build)相比,ODI支持更多的異構數據源,支持SOA,支持Jython,和OWB正好互補。ODI和OWB都是所謂的ELT工具,和通常所見的ETL工具不同,它們不是採用獨立的引擎而是採用RDBMS進行數據轉換。做爲領先的RDBMS供應商,Oracle選擇ELT而不是ETL不是沒有道理的。

知識庫

ODI所有模塊的信息都保存在一個叫做Master Repository的中心知識庫中。Master Repository通過Master Repository Creation Wizard創建,這也是安裝完ODI後應該做的第一個任務。

除了Master Repository,還需要爲不同的任務創建Work Repository。Work Repository中的信息包括模塊信息,項目信息和運行期信息。

圖形模塊

Designer 用於定義數據轉換邏輯,這是最常用的開發工具,大部分的開發任務,包括data store的定義,interface(數據映射關係)和package(相當於workflow)的創建等,都是在Designer中完成。

Operator用於管理和監控數據轉換任務的執行情況,在設計階段,也可用於調試(debugging)

Topology Manager用於定義物理和邏輯基礎架構,如work repository的創建和管理等。

Security Manager用於管理用戶權限

1、Topology manager定義物理和邏輯架構,就是配置不同庫的url,sid什麼的。

2、Designer進行數據傳輸的操作(不同庫表數據的傳輸,傳輸方式很多種(牛B之處))

3、Operator查看數據傳輸的結果(傳輸成功,還是失敗,失敗的原因等等)。

運行期組件

Schedule Agent計劃代理,用於調度執行數據轉換任務。計劃代理同時也帶有一個數據轉換引擎,但是ODI採用E-LT架構,所以基本上計劃代理只是將任務傳遞給目標庫,其數據轉換引擎很少用到。

附:安裝完ODI後默認用戶名爲SUPERVISOR,密碼爲SUNOPSIS,大小寫敏感。

ODI開發(Oracle Data Integrator)

ODI就是一個導數的工具,用IMP,EXP加個FTP和定時crontab一樣可以實現導數,只不過,odi更加強大,可以實現更多的功能,等你上個項目,當你接口實現不了需求的時候,你就知道要用存儲過程了,odi可以刷新執行,定時執行,不同的庫數據導給同一個庫用來出報表,大致如此,沒有必要扣什麼數據挖掘,除非售前也歸你,向客戶兜售ODI,才需要扯一些什麼數據倉儲,數據挖掘之類的。

事實表和維表

事實表和維表多對一的關係。

比如事實表每條記錄對應一次洗衣粉銷售行爲,其中一個字段爲洗衣粉品牌代碼;而維表中保存唯一的品牌和品牌代碼,兩表通過代碼關聯;這樣就可以從品牌的角度對洗衣粉銷售進行分析。

 

其實主要的區別我想是:

事實表是記錄你要分析的東西;

維表是你要用來度量你要分析指標的東西;

就是說一個是對象,一個是尺度。

維度:   

多維數據集的一種結構特性,是描述事實數據表中的數據的類別(級別)的有組織的層次結構。這些類別通常描述相似成員的集合,用戶要根據它們進行分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章