Oracle Data Integrator 学习一

Oracle Data Integrator

ODI(Oracle Data Integrator)是Oracle在2006年10月收购Sunopsis公司后,整合Sunopsis Active Integration Platform而推出的一款数据集成工具,现在是Oracle Fusion Middleware的组件。和Oracle自己的OWB(Oracle Warehouse Build)相比,ODI支持更多的异构数据源,支持SOA,支持Jython,和OWB正好互补。ODI和OWB都是所谓的ELT工具,和通常所见的ETL工具不同,它们不是采用独立的引擎而是采用RDBMS进行数据转换。做为领先的RDBMS供应商,Oracle选择ELT而不是ETL不是没有道理的。

知识库

ODI所有模块的信息都保存在一个叫做Master Repository的中心知识库中。Master Repository通过Master Repository Creation Wizard创建,这也是安装完ODI后应该做的第一个任务。

除了Master Repository,还需要为不同的任务创建Work Repository。Work Repository中的信息包括模块信息,项目信息和运行期信息。

图形模块

Designer 用于定义数据转换逻辑,这是最常用的开发工具,大部分的开发任务,包括data store的定义,interface(数据映射关系)和package(相当于workflow)的创建等,都是在Designer中完成。

Operator用于管理和监控数据转换任务的执行情况,在设计阶段,也可用于调试(debugging)

Topology Manager用于定义物理和逻辑基础架构,如work repository的创建和管理等。

Security Manager用于管理用户权限

1、Topology manager定义物理和逻辑架构,就是配置不同库的url,sid什么的。

2、Designer进行数据传输的操作(不同库表数据的传输,传输方式很多种(牛B之处))

3、Operator查看数据传输的结果(传输成功,还是失败,失败的原因等等)。

运行期组件

Schedule Agent计划代理,用于调度执行数据转换任务。计划代理同时也带有一个数据转换引擎,但是ODI采用E-LT架构,所以基本上计划代理只是将任务传递给目标库,其数据转换引擎很少用到。

附:安装完ODI后默认用户名为SUPERVISOR,密码为SUNOPSIS,大小写敏感。

ODI开发(Oracle Data Integrator)

ODI就是一个导数的工具,用IMP,EXP加个FTP和定时crontab一样可以实现导数,只不过,odi更加强大,可以实现更多的功能,等你上个项目,当你接口实现不了需求的时候,你就知道要用存储过程了,odi可以刷新执行,定时执行,不同的库数据导给同一个库用来出报表,大致如此,没有必要扣什么数据挖掘,除非售前也归你,向客户兜售ODI,才需要扯一些什么数据仓储,数据挖掘之类的。

事实表和维表

事实表和维表多对一的关系。

比如事实表每条记录对应一次洗衣粉销售行为,其中一个字段为洗衣粉品牌代码;而维表中保存唯一的品牌和品牌代码,两表通过代码关联;这样就可以从品牌的角度对洗衣粉销售进行分析。

 

其实主要的区别我想是:

事实表是记录你要分析的东西;

维表是你要用来度量你要分析指标的东西;

就是说一个是对象,一个是尺度。

维度:   

多维数据集的一种结构特性,是描述事实数据表中的数据的类别(级别)的有组织的层次结构。这些类别通常描述相似成员的集合,用户要根据它们进行分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章