Mastering Data Warehouse Design
數據倉庫設計
【原 書 名】 Mastering Data Warehouse Design:Relational and Dimensional Techniques
【原出版社】 John Wiley & sons,Inc.
【作 者】(美)Claudia Imhoff,Nicholas Galemmo,Jonathan G.Geiger
【叢 書 名】 數據庫技術叢書
【出 版 社】 機械工業出版社 【書 號】 7111139631
【出版日期】 2004 年12月 【開 本】 16開 【頁 碼】 312 【版 次】1-1
說明:
中文書缺貨,也沒有電子版下載,只下到英文版。決定讀英文原著,並同時把它翻譯過來。貼到這裏,請各位多多指教。
【內容簡介】
大多數數據倉庫的管理者、設計者和開發者都熟悉Ralph Kimball在2001年寫給數據倉庫界的那封公開信。在信中,他向Inmon陣營提出了挑戰,要求回答關於關係式方法有效性的棘手問題。由最著名的Inmon方法專家--Claudia Imhoff和其他作者合寫的這本書,正面回答了Kimball公開信中提出的挑戰性問題,併爲在複雜的業務智能環境中如何正確地應用關係式和多維式兩種建模技術提供了指導。
主要內容如下:
●在已經囊括了所有行業的各種公司的數據倉庫環境中,已知哪種方法是最成功的
●給出了關係方法和多維方法的正反兩方面意見對比,開發者可以確定最適合的方法
●爲什麼體系結構應該包括建立在關係數據模型概念之上的數據倉庫
●鍵的構造和使用,數據倉庫、層次及事務型數據的歷史性質
●爲了保證數據倉庫能滿足較好的性能要求,所需要解決的技術問題
●爲保證最優數據倉庫性能和處理隨時間變化的數據,所需要的關係建模技術
本書全面論述了設計和建立高效、可持續發展且可擴展的數據倉庫的方法,重點論述了建立各種數據模型的方法。主要內容包括業務智能環境和數據模型的概念、數據模型分類、數據模型的開發步驟、各種數據的建模方法、數據倉庫的優化與擴展、數據模型的維護、關係型解決方案的部署、多維體系結構與企業信息工廠的比較等。
本書主要面向數據倉庫的設計者和構建者以及數據倉庫技術研究人員,同時也適合對數據倉庫技術和企業信息化建設感興趣的其他讀者閱讀。
譯者序
第一部分 基本概念
第1章 緒論
1.1 業務智能概述
1.2 什麼是數據倉庫
1.2.1 數據倉庫的作用和用途
1.2.2 企業信息工廠
1.3 數據倉庫的多用途性
1.3.1 支持的數據集市類型
1.3.2 支持的BI技術類型
1.4 可維護的數據倉庫環境的特點
1.5 數據倉庫數據模型
1.5.1 非冗餘性
1.5.2 穩定性
1.5.3 一致性
1.5.4 最終數據使用方面的靈活性
1.5.5 Codd和Date前提
1.6 建立數據集市的效果
1.7 小結
第2章 關係的基本概念
2.1 爲什麼需要數據模型
2.2 關係數據模型的建模對象
2.2.1 主題
2.2.2 實體
2.2.3 元素或屬性
2.2.4 聯繫
2.3 數據模型的類型
2.3.1 主題域模型
2.3.2 業務數據模型
2.3.3 系統模型
2.3.4 技術模型
2.4 關係數據建模指南
2.4.1 指導方針與最合適的做法
2.4.2 規範化
2.5 關係數據模型的規範化
2.5.1 第1範式
2.5.2 第2範式
2.5.3 第3範式
2.5.4 其他規範化級別
2.6 小結
第二部分 模型開發
第3章 理解業務模型
3.1 業務場景
3.2 主題域模型
3.2.1 關於特定行業的考慮
3.2.2 主題域模型開發過程
3.2.3 Zenith汽車公司的主題域模型
3.3 業務數據模型
3.4 小結
第4章 模型開發
4.1 方法學
4.1.1 步驟1:選擇感興趣的數據
4.1.2 步驟2:在鍵中增加時間
4.1.3 步驟3:增加派生數據
4.1.4 步驟4:確定粒度級別
4.1.5 步驟5:彙總數據
4.1.6 步驟6:合併實體
4.1.7 步驟7:建立數組
4.1.8 步驟8:分離數據
4.2 小結
第5章 鍵的建立和維護
5.1 業務背景
5.1.1 不一致的客戶業務定義
5.1.2 不一致的客戶系統定義
5.1.3 系統之間不一致的客戶標識
5.1.4 包含外部數據
5.1.5 由角色唯一確定的客戶
5.1.6 未加說明的客戶層次結構
5.2 數據倉庫系統模型
5.2.1 不一致的客戶業務定義
5.2.2 不一致的客戶系統定義
5.2.3 系統之間不一致的客戶標識
5.2.4 吸收外部數據
5.2.5 由角色唯一確定的客戶
5.2.6 未加說明的客戶層次結構
5.3 數據倉庫技術模型
5.3.1 來自現存系統的鍵
5.3.2 來自公認標準的鍵
5.3.3 代理鍵
5.4 多維數據集市的含義
5.4.1 多維模型中的差異
5.4.2 多維一致性的維護
5.5 小結
第6章 日曆建模
6.1 業務中的日曆
6.1.1 日曆類型
6.1.2 其他財務日曆
6.1.3 日曆的元素
6.1.4 日曆時間跨度
6.2 時間和數據倉庫
6.2.1 時間的性質
6.2.2 時間的標準化
6.3 數據倉庫系統模型
6.4 案例分析:簡單財務日曆
6.4.1 分析
6.4.2 一個簡單日曆模型
6.5 案例分析:位置有關日曆
6.5.1 分析
6.5.2 GOSH日曆模型
6.5.3 日曆交付
6.6 案例分析:多語種日曆
6.6.1 分析
6.6.2 多國語言的存儲
6.6.3 不同日期表示格式的處理
6.6.4 多語種交付
6.7 案例分析:多重財務日曆
6.7.1 分析
6.7.2 擴展日曆
6.8 案例分析:季節日曆
6.8.1 分析
6.8.2 季節日曆的結構
6.8.3 季節數據交付
6.9 小結
第7章 層次樹建模
7.1 業務中的層次樹
7.2 層次樹的性質
7.2.1 層次樹的深度
7.2.2 層次樹的父子關係
7.2.3 層次樹的結構
7.2.4 歷史
7.2.5 層次樹類型小結
7.3 案例分析:零售層次樹
7.3.1 層次樹的分析
7.3.2 層次樹的實現
7.4 案例分析:銷售和產量計劃安排
7.4.1 分析
7.4.2 產品層次樹
7.4.3 客戶層次樹
7.5 案例分析:零售採購
7.5.1 分析
7.5.2 業務模型的實現
7.6 案例分析:套裝
7.6.1 分析
7.6.2 材料清單的加入
7.6.3 數據的發佈
7.7 結構的變換
7.7.1 遞歸樹的構建
7.7.2 遞歸樹的平面化
7.8 小結
第8章 事務建模
8.1 業務型事務
8.1.1 數據倉庫的業務應用
8.1.2 每個事務的平均行數
8.1.3 涉及變化的業務規則
8.2 應用接口
8.2.1 快照接口
8.2.2 增量接口
8.2.3 數據庫事務日誌
8.3 事務數據的交付
8.4 案例分析:銷售訂單快照
8.4.1 訂單的變換
8.4.2 技術1:完全快照捕捉
8.4.3 技術2:變化快照捕捉
8.4.4 技術3:具有增量捕捉的變化快照
8.4.5 裝載處理
8.5 案例分析:事務接口
8.5.1 事務的建模
8.5.2 事務的處理
8.6 小結
第9章 數據倉庫優化
9.1 開發過程的優化
9.1.1 設計和分析的優化
9.1.2 應用開發的優化
9.2 數據庫的優化
9.2.1 數據聚簇
9.2.2 表劃分
9.2.3 實施參照完整性
9.2.4 按索引組織的表
9.2.5 索引技術
9.2.6 小結
9.3 系統模型的優化
9.3.1 垂直劃分
9.3.2 逆規範化
9.3.3 子類型聚簇
9.4 小結
第三部分 操作和管理
第10章 對業務變化的適應
10.1 數據倉庫的變化
10.1.1 變化的緣由
10.1.2 對變化的控制
10.1.3 變化的實現
10.2 業務變化的建模
10.2.1 設想最壞的情況
10.2.2 對聯繫的概化
10.2.3 使用代理鍵
10.3 業務變化的實現
10.3.1 主題域的集成
10.3.2 增加主題域
10.4 小結
第11章 模型維護
11.1 模型及其演進的管理
11. 1.1 主題域模型
11.1.2 業務數據模型
11.1.3 系統數據模型
11.1.4 技術數據模型
11.1.5 同步的含義
11.2 模型的協調
11.2.1 主題域和業務數據模型
11.2.2 業務數據模型和系統數據模型
11.2.3 系統數據模型和技術數據模型
11.3 對多個建模師的管理
11.3.1 作用和職責
11.3.2 衝突管理
11.4 小結
第12章 關係型解決方案的部署
12.1 數據集市的混亂
12.1.1 爲什麼糟糕
12.1.2 "體系結構方式"準則
12.2 從數據集市混亂結構中遷移出來
12.2.1 維的一致化
12.2.2 建立數據倉庫數據模型
12.2.3 建立數據倉庫
12.2.4 僅僅以"體系結構方式"建立新的數據集市--不理會舊的集市
12.2.5 從一個數據集市建立體系結構
12.3 選擇正確的遷移路徑
12.4 小結
第13章 數據倉庫設計方法學比較
13.1 多維體系結構
13.2 企業信息工廠體系結構
13.3 CIF體系結構和MD體系結構的比較
13.3.1 範圍
13.3.2 角度
13.3.3 數據流
13.3.4 易失性
13.3.5 靈活性
13.3.6 複雜性
13.3.7 功能性
13.3.8 持續的維護
13.4 小結
術語表
參考文獻
作者介紹:
Claudia Imhoff, Ph.D,Intelligent Solutions公司(www.IntelSols.com)的總裁和創始人,CRM及BI的首席顧問。在很多企業,大學及技術公司,她是一個受歡迎的演說家和國際知名專家,在該領域,她與人合作出版了5本專著及 50篇論文。
Nicholas Galemmo 美國雀巢公司的信息系統架構師,在製造業,商品流通,教育,軍事,衛生保健,金融行業的應用系統設計和開發領域有27年的經驗,有11年參與大型數據倉庫和系統集成項目經驗,使用維度和關係架構建立了很多數據倉庫,發表了很多論文,參加過國家級學術會議。這是他的第一本書。
Jonathan G. Geiger 是Intelligent Solutions公司的執行副總裁,在公用事業,電信,製造業,教育,化學,金融,零售等行業參與企業信息公司(CIF)及客戶關係管理(CRM)項目的開發。在30年的實踐及諮詢從業生涯中,涉及到信息管理的各個方面,獨自出版或與人合作出版了2本書及30多篇論文,經常出席國際及國際學術會議,並在幾個研討會上講授。
Claudia Imhoff, Ph.D. is the president and founder of Intelligent Solutions (www.IntelSols.com), a leading consultancy on CRM (Customer Relationship Management) and business intelligence technologies and strategies. She is a popular speaker and internationally recognized expert and serves as an advisor to many corporations, universities, and leading technology companies on
these topics. She has coauthored five books and over 50 articles on these topics. She can be reached at [email protected].
Nicholas Galemmo was an information architect at Nestlé USA. Nicholas has 27 years’ experience as a practitioner and consultant involved in all aspects of application systems design and development within the manufacturing, distribution, education, military, health care, and financial industries. He has been actively involved in large-scale data warehousing and systems integration projects for the past 11 years. He has built numerous data warehouses, using both dimensional and relational architectures. He has published many articles and has presented at national conferences. This is his first book. Mr. Galemmo is now an independent consultant and can be reached at [email protected].
Jonathan G. Geiger is executive vice president at Intelligent Solutions, Inc. Jonathan has been involved in many Corporate Information Factory and customer relationship management projects within the utility, telecommunications, manufacturing, education, chemical, financial, and retail industries. In his 30 years as a practitioner and consultant, Jonathan has managed or performed
work in virtually every aspect of information management. He has authored or coauthored over 30 articles and two other books, presents frequently at national and international conferences, and teaches several public seminars. Mr. Geiger can be reached at [email protected].