HBASE基礎
1. HBase簡介
HBase是一個高可靠、高性能、面向列的,主要用於海量結構化和半結構化數據存儲的分佈式key-value存儲系統。
它基於Google Bigtable開源實現,但二者有明顯的區別:Google Bigtable基於GFS存儲,通過MAPREDUCE處理存儲的數據,通過chubby處理協同服務;而HBase底層存儲基於hdfs,可以利用MapReduce、Spark等計算引擎處理其存儲的數據,通過Zookeeper作爲處理HBase集羣協同服務。
2. HBase表結構
HBase以表的形式將數據最終存儲的hdfs上,建表時無需指定表中字段,只需指定若干個列簇即可。插入數據時,指定任意多個列到指定的列簇中。通過行鍵、列簇、列和時間戳可以對數據進行快速定位。
2.1 行鍵(row key)
HBase基於ro