2.1Hadoop的限制
Hadoop只能執行批量處理,並且只能以順序的方式訪問數據,導致隨機訪問的效率較低。
2.2HBase的存儲機制
HBase可以存儲海量數據,並且以隨機方式訪問數據。
HBase是一個分佈式的面向列的數據庫,在表中由行進行排序。在創建表的時候就指定列族,定義列的時候以列族:列名鍵值對的形式定義。一個表有多個列族,每個列族可以有任意數量的列。後續列的值連續地存儲在磁盤上。表中的每個單元格即每個列都有具體的時間戳。
在HBase中:
- 表是行的集合
- 行是列族的集合
- 列族是列的集合
- 列是鍵值對的結合
下面是表模式的例子