HBase存儲機制

2.1Hadoop的限制

Hadoop只能執行批量處理,並且只能以順序的方式訪問數據,導致隨機訪問的效率較低。

2.2HBase的存儲機制

HBase可以存儲海量數據,並且以隨機方式訪問數據。

HBase是一個分佈式的面向列的數據庫,在表中由行進行排序。在創建表的時候就指定列族,定義列的時候以列族:列名鍵值對的形式定義。一個表有多個列族,每個列族可以有任意數量的列。後續列的值連續地存儲在磁盤上。表中的每個單元格即每個列都有具體的時間戳。

在HBase中:

  1. 表是行的集合
  2. 行是列族的集合
  3. 列族是列的集合
  4. 列是鍵值對的結合

 下面是表模式的例子

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章