Hive建模 類型

推薦大家去看原文博主的文章,條理清晰閱讀方便,轉載是爲了方便以後個人查閱

https://www.cnblogs.com/xupccc/p/9544575.html

1、介紹

Hive作爲數據倉庫,同關係型數據庫開發過程類似,都需要先進行建模,所謂建模,就是對錶之間指定關係方式。建模在hive中大致分爲星型、雪花型和星座型。要對建模深入理解,首先需要對hive數倉中的集中表概念進行界定。hive中的表從形態上分內部表、外部表、桶表、分區表。在數據邏輯上劃分爲維度表和事實表。維度表等價於我們常說的字典表。事實表就是字典表之外的數據表。

1.1 星型

多張維度表,一張事實表,維度表之間沒有關係。查詢性能要好些,存儲有冗餘的。星型模型使用的比較多。

1.2 雪花型

雪花型是星型建模的擴展,維度表之間有關係。存儲減少冗餘,查詢性能有損失,需要多級連接。和星型模型的共性就是隻有一張是事實表。

1.3 星座型

星座型也是星型模型的擴展,存在多張事實表。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章