《数据仓库设计》 中英文对照——介绍

Mastering Data Warehouse Design 

数据仓库设计 

【原 名】 Mastering Data Warehouse Design:Relational and Dimensional Techniques

【原出版社】 John Wiley & sons,Inc.

【作  者】(美)Claudia Imhoff,Nicholas Galemmo,Jonathan G.Geiger

【译  者】 于戈[同译者作品] 鲍玉斌 王大玲

【丛 名】 数据库技术丛书

【出 社】 机械工业出版社     【书 号】 7111139631

【出版日期】 2004 12 【开 本】 16 【页 码】 312     【版 次】1-1

 

说明:

中文书缺货,也没有电子版下载,只下到英文版。决定读英文原著,并同时把它翻译过来。贴到这里,请各位多多指教。

 

【内容简介】

大多数数据仓库的管理者、设计者和开发者都熟悉Ralph Kimball2001年写给数据仓库界的那封公开信。在信中,他向Inmon阵营提出了挑战,要求回答关于关系式方法有效性的棘手问题。由最著名的Inmon方法专家--Claudia Imhoff和其他作者合写的这本书,正面回答了Kimball公开信中提出的挑战性问题,并为在复杂的业务智能环境中如何正确地应用关系式和多维式两种建模技术提供了指导。
主要内容如下:
在已经囊括了所有行业的各种公司的数据仓库环境中,已知哪种方法是最成功的
给出了关系方法和多维方法的正反两方面意见对比,开发者可以确定最适合的方法
为什么体系结构应该包括建立在关系数据模型概念之上的数据仓库
键的构造和使用,数据仓库、层次及事务型数据的历史性质
为了保证数据仓库能满足较好的性能要求,所需要解决的技术问题
为保证最优数据仓库性能和处理随时间变化的数据,所需要的关系建模技术
本书全面论述了设计和建立高效、可持续发展且可扩展的数据仓库的方法,重点论述了建立各种数据模型的方法。主要内容包括业务智能环境和数据模型的概念、数据模型分类、数据模型的开发步骤、各种数据的建模方法、数据仓库的优化与扩展、数据模型的维护、关系型解决方案的部署、多维体系结构与企业信息工厂的比较等。
本书主要面向数据仓库的设计者和构建者以及数据仓库技术研究人员,同时也适合对数据仓库技术和企业信息化建设感兴趣的其他读者阅读。

 

译者序

第一部分  基本概念

1  绪论

11  业务智能概述

12  什么是数据仓库

121  数据仓库的作用和用途

122  企业信息工厂

13  数据仓库的多用途性

131  支持的数据集市类型

132  支持的BI技术类型

14  可维护的数据仓库环境的特点

15  数据仓库数据模型

151  非冗余性

152  稳定性

153  一致性

154  最终数据使用方面的灵活性

155  CoddDate前提

16  建立数据集市的效果

17  小结

2  关系的基本概念

21  为什么需要数据模型

22  关系数据模型的建模对象

221  主题

222  实体

223  元素或属性

224  联系

23  数据模型的类型

231  主题域模型

232  业务数据模型

233  系统模型

234  技术模型

24  关系数据建模指南

241  指导方针与最合适的做法

242  规范化

25  关系数据模型的规范化

251  1范式

252  2范式

253  3范式

254  其他规范化级别

26  小结

第二部分  模型开发

3  理解业务模型

31  业务场景

32  主题域模型

321  关于特定行业的考虑

322  主题域模型开发过程

323  Zenith汽车公司的主题域模型

33  业务数据模型

34  小结

4  模型开发

41  方法学

411  步骤1:选择感兴趣的数据

412  步骤2:在键中增加时间

413  步骤3:增加派生数据

414  步骤4:确定粒度级别

415  步骤5:汇总数据

416  步骤6:合并实体

417  步骤7:建立数组

418  步骤8:分离数据

42  小结

5  键的建立和维护

51  业务背景

511  不一致的客户业务定义

512  不一致的客户系统定义

513  系统之间不一致的客户标识

514  包含外部数据

515  由角色唯一确定的客户

516  未加说明的客户层次结构

52  数据仓库系统模型

521  不一致的客户业务定义

522  不一致的客户系统定义

523  系统之间不一致的客户标识

524  吸收外部数据

525  由角色唯一确定的客户

526  未加说明的客户层次结构

53  数据仓库技术模型

531  来自现存系统的键

532  来自公认标准的键

533  代理键

54  多维数据集市的含义

541  多维模型中的差异

542  多维一致性的维护

55  小结

6  日历建模

61  业务中的日历

611  日历类型

612  其他财务日历

613  日历的元素

614  日历时间跨度

62  时间和数据仓库

621  时间的性质

622  时间的标准化

63  数据仓库系统模型

64  案例分析:简单财务日历

641  分析

642  一个简单日历模型

65  案例分析:位置有关日历

651  分析

652  GOSH日历模型

653  日历交付

66  案例分析:多语种日历

661  分析

662  多国语言的存储

663  不同日期表示格式的处理

664  多语种交付

67  案例分析:多重财务日历

671  分析

672  扩展日历

68  案例分析:季节日历

681  分析

682  季节日历的结构

683  季节数据交付

69  小结

7  层次树建模

71  业务中的层次树

72  层次树的性质

721  层次树的深度

722  层次树的父子关系

723  层次树的结构

724  历史

725  层次树类型小结

73  案例分析:零售层次树

731  层次树的分析

732  层次树的实现

74  案例分析:销售和产量计划安排

741  分析

742  产品层次树

743  客户层次树

75  案例分析:零售采购

751  分析

752  业务模型的实现

76  案例分析:套装

761  分析

762  材料清单的加入

763  数据的发布

77  结构的变换

771  递归树的构建

772  递归树的平面化

78  小结

8  事务建模

81  业务型事务

811  数据仓库的业务应用

812  每个事务的平均行数

813  涉及变化的业务规则

82  应用接口

821  快照接口

822  增量接口

823  数据库事务日志

83  事务数据的交付

84  案例分析:销售订单快照

841  订单的变换

842  技术1:完全快照捕捉

843  技术2:变化快照捕捉

844  技术3:具有增量捕捉的变化快照

845  装载处理

85  案例分析:事务接口

851  事务的建模

852  事务的处理

86  小结

9  数据仓库优化

91  开发过程的优化

911  设计和分析的优化

912  应用开发的优化

92  数据库的优化

921  数据聚簇

922  表划分

923  实施参照完整性

924  按索引组织的表

925  索引技术

926  小结

93  系统模型的优化

931  垂直划分

932  逆规范化

933  子类型聚簇

94  小结

第三部分  操作和管理

10  对业务变化的适应

101  数据仓库的变化

1011  变化的缘由

1012  对变化的控制

1013  变化的实现

102  业务变化的建模

1021  设想最坏的情况

1022  对联系的概化

1023  使用代理键

103  业务变化的实现

1031  主题域的集成

1032  增加主题域

104  小结

11  模型维护

111  模型及其演进的管理

11. 11  主题域模型

1112  业务数据模型

1113  系统数据模型

1114  技术数据模型

1115  同步的含义

112  模型的协调

1121  主题域和业务数据模型

1122  业务数据模型和系统数据模型

1123  系统数据模型和技术数据模型

113  对多个建模师的管理

1131  作用和职责

1132  冲突管理

114  小结

12  关系型解决方案的部署

121  数据集市的混乱

1211  为什么糟糕

1212  "体系结构方式"准则

122  从数据集市混乱结构中迁移出来

1221  维的一致化

1222  建立数据仓库数据模型

1223  建立数据仓库

1224  仅仅以"体系结构方式"建立新的数据集市--不理会旧的集市

1225  从一个数据集市建立体系结构

123  选择正确的迁移路径

124  小结

13  数据仓库设计方法学比较

131  多维体系结构

132  企业信息工厂体系结构

133  CIF体系结构和MD体系结构的比较

1331  范围

1332  角度

1333  数据流

1334  易失性

1335  灵活性

1336  复杂性

1337  功能性

1338  持续的维护

134  小结

术语表

参考文献

 

 

 

作者介绍:

Claudia Imhoff, Ph.DIntelligent Solutions公司www.IntelSols.com的总裁和创始人CRMBI的首席顾问。在很多企业,大学及技术公司,她是一个受欢迎的演说家和国际知名专家,在该领域,她与人合作出版了5本专著及 50篇论文。

 

Nicholas Galemmo 美国雀巢公司的信息系统架构师,在制造业,商品流通,教育,军事,卫生保健,金融行业的应用系统设计和开发领域有27年的经验,有11年参与大型数据仓库和系统集成项目经验,使用维度和关系架构建立了很多数据仓库,发表了很多论文,参加过国家级学术会议。这是他的第一本书。

 

Jonathan G. Geiger Intelligent Solutions公司的执行副总裁,在公用事业,电信,制造业,教育,化学,金融,零售等行业参与企业信息公司(CIF)及客户关系管理(CRM)项目的开发。在30年的实践及咨询从业生涯中,涉及到信息管理的各个方面,独自出版或与人合作出版了2本书及30多篇论文,经常出席国际及国际学术会议,并在几个研讨会上讲授。

 

Claudia Imhoff, Ph.D. is the president and founder of Intelligent Solutions (www.IntelSols.com), a leading consultancy on CRM (Customer Relationship Management) and business intelligence technologies and strategies. She is a popular speaker and internationally recognized expert and serves as an advisor to many corporations, universities, and leading technology companies on

these topics. She has coauthored five books and over 50 articles on these topics. She can be reached at [email protected].

Nicholas Galemmo was an information architect at Nestlé USA. Nicholas has 27 years’ experience as a practitioner and consultant involved in all aspects of application systems design and development within the manufacturing, distribution, education, military, health care, and financial industries. He has been actively involved in large-scale data warehousing and systems integration projects for the past 11 years. He has built numerous data warehouses, using both dimensional and relational architectures. He has published many articles and has presented at national conferences. This is his first book. Mr. Galemmo is now an independent consultant and can be reached at [email protected].

Jonathan G. Geiger is executive vice president at Intelligent Solutions, Inc. Jonathan has been involved in many Corporate Information Factory and customer relationship management projects within the utility, telecommunications, manufacturing, education, chemical, financial, and retail industries. In his 30 years as a practitioner and consultant, Jonathan has managed or performed

work in virtually every aspect of information management. He has authored or coauthored over 30 articles and two other books, presents frequently at national and international conferences, and teaches several public seminars. Mr. Geiger can be reached at [email protected].

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章