數據百問系列:學習數據倉庫該看什麼書?

0x00 前言

關於數據倉庫書的問題被太多小夥伴問到了,因此,即使本文已經發過好幾次了,依舊要在數據百問系列中再次發一遍。已經看過本文的小夥伴可以不用再看了。

在我們十多個數據交流羣中,大家經常會問有什麼數據相關的書可以推薦,因此居士建立了一個共享文檔,大家把自己認爲不錯的書推薦出來,並寫上推薦語。

居士會定期從中選出一些不錯的推薦書目,整理後分享給大家,所以就有了《好書推薦》系列,此爲第一篇:推薦幾本數據倉庫的經典書。

-w1285

0x01 書籍推薦

每次推薦書不會太多,但是儘量做到每次推薦的都是值得讀的~

《大數據之路:阿里巴巴大數據實踐》

書名:大數據之路:阿里巴巴大數據實踐

推薦人:木東居士

推薦原因:逢人必推的一本書!不過紙質版的書已經很難買到了,想看電子版的,可以在公衆號中回覆 大數據之路 五個字即可下載。

阿里的大數據最佳實踐,基本上講了阿里在大數據實踐上的方方面面,特別是數據模型的設計和實踐,理論和實踐結合的比較好,是我目前看到最好的一本書。

該書可作爲整個數據體系建設的參考書,從數據平臺到數據倉庫到數據應用,都有比較不錯的講解。另外,本書的很多論述可以用作方案設計、老闆彙報、晉升答辯等,值得反覆看。

《數據倉庫工具箱(第3版):維度建模權威指南》

書名:數據倉庫工具箱(第3版):維度建模權威指南

推薦人:木東居士

推薦原因

維度建模是大師 Ralph Kimball 所倡導的, 這本《數據倉庫工具箱》是數據倉庫經典書籍,特別是維度建模相關的內容非常權威,目前市面上能買到的書,很少有比這個更權威的了。

優點

  1. 實踐性較強,基本所有的概念都有例子說明

  2. 易懂,語言通俗易懂

缺點

  1. 示例都是傳統行業

  2. 還是有一些抽象的概念,零基礎來讀,可能要花點時間,畢竟經典的數據都需要一些上層次抽象的概念。

數據倉庫(原書第4版)

書名:數據倉庫工具箱(第3版):維度建模權威指南

推薦人:木東居士

推薦原因

範式是數據庫邏輯模型設計的基本理論,一個關係模型可以從第一範式到第五範式進行無損分解。在數據倉庫的模型設計中目前一般採用第三範式。範式模型由數據倉庫之父 Inmon 提倡,而這本書就是 Inmon 所寫。

這本書是我看的第二本數據倉庫的書,個人感受是理論比較強,剛開始看基本就是一頭霧水,然後當你做了一段時間後,再回頭來看這本書會有很多理論指導,比如說元數據該怎麼做,模型該怎麼設計,參考性很強。

即使工作了一段時間後,來看這本書依舊感覺比較費勁兒,所以本書翻的比較少,只是偶爾想起來會看一下。但是,不可否認,這本書也是數倉領域的經典。

《大數據日知錄》

書名:大數據日知錄

推薦人:木東居士

推薦原因

這本書主要偏向於各種大數據系統的原理,是居士翻的最多的一本技術書了,基本上把現在流行的大數據組件都介紹了一遍,深度和廣度都有,每章內容後面也都有相應的論文推薦。

推薦這本書的原因就在於現在大部分互聯網公司的數據倉庫都是基於這一套大數據框架來的,更準確的來講,大家其實都是先工程,後理論,因此這本書可以作爲對大數據生態的一覽。

0xFF 總結

數倉的書,大部分年代都比較久一些,新出的一些書可參考性並不強。關於數倉,大家可以參考上面的幾本書書,結合居士寫的一些數倉文章,還是比較穩的。

以後新推薦書會在本文的評論中推薦。歡迎持續關注本文。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章