HBase表预分区

原創

2020-06-20 21:28

HBase 预分区

在创建HBase表的时候默认一张表只有一个region，所有的put操作都会往这一个region中填充数据，当这个一个region过大时就会进行split。如果在创建HBase的时候就进行预分区则会减少当数据量猛增时由于region split带来的资源消耗。

HBase表的预分区需要紧密结合业务场景来选择分区的key值，每个region都有一个startKey和一个endKey来表示该region存储的rowKey范围。

创建包含预分区表的命令如下：

> create 't1', 'cf', SPLITS => ['20150501000000000', '20150515000000000', '20150601000000000']

或者

> create 't2', 'cf', SPLITS_FILE => '/home/hadoop/splitfile.txt'

/home/hadoop/splitfile.txt中存储内容如下：
20150501000000000
20150515000000000
20150601000000000

该语句会创建4个region：

                startkey                    endkey
region0         -                           20150501000000000
region1         20150501000000000           20150515000000000
region2         20150515000000000           20150601000000000
region3         20150601000000000           -

// region0没有startKey
// region3没有endKey

// 当put的一条数据rowKey值为20150516000000000时则会放入region2中

从HBase的Web UI中可以查看到表的分区

每个region的命名方式如下：[table],[region start key],[region id]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

学习必备——HBase和Zookeeper安装

操作系統:centos7.4 chd的HBase發行版:hbase-1.2.0-cdh5.15.1 chd的Zookeeper發行版:zookeeper-3.4.5-cdh5.15.1.tar.gz 由於 HBase 是使用

爱做梦的锤子

2020-07-07 23:22:40

HBase概述（概念、数据模型、特点和优势）

目錄HBase是什麼？HBase與RDBMS對比數據模型NameSpaceTableRow KeyColumns FamilyTimeStampCellHBase的特點 HBase是什麼？ HBase是一個高可靠性、高性能、面向

2020-07-07 14:12:54

HBase 增量备份

Author：Pirate Leo myBlog: http://blog.csdn.net/pirateleo/ myEmail: [email protected] 轉載請註明出處，謝謝。文中可能涉及到的API：

胡同里的民工

2020-07-07 09:10:55

HBase 超详细优化

高可用在HBase中Hmaster負責監控RegionServer的生命週期，均衡RegionServer的負載，如果Hmaster掛掉了，那麼整個HBase集羣將陷入不健康的狀態，並且此時的工作狀態並不會維持太久。所以HBas

大数据小同学

2020-07-07 01:19:07

HBase扩展布隆过滤器

HBase在商業項目中的能力每天：消息量：發送和接收的消息數超過60億將近1000億條數據的讀寫高峯期每秒150萬左右操作整體讀取數據佔有約55%，寫入佔有45% 超過2PB的數據，涉及冗餘共6PB數據數據每月大概增

大数据小同学

2020-07-07 00:39:19

HBase详细简介

什麼是HBase HBase的原型是Google的BigTable論文，受到了該論文思想的啓發，目前作爲Hadoop的子項目來開發維護，用於支持結構化的數據存儲。官方網站：http://hbase.apache.org – 20

大数据小同学

2020-07-07 00:39:19

HBase详细原理

讀流程 Client先訪問zookeeper，從meta表讀取region的位置，然後讀取meta表中的數據。meta中又存儲了用戶表的region信息；根據namespace、表名和rowkey在meta表中找到對應的re

大数据小同学

2020-07-07 00:39:19

HBase详细安装

Zookeeper正常部署首先保證Zookeeper集羣的正常部署，並啓動之： [liujh@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start [liujh@hadoop103

大数据小同学

2020-07-07 00:39:19

HBase 详细API操作

環境準備新建項目後在pom.xml中添加依賴： <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifac

大数据小同学

2020-07-07 00:39:19

HBase 与Hive的集成详解

HBase與Hive的對比 Hive 數據倉庫 Hive的本質其實就相當於將HDFS中已經存儲的文件在Mysql中做了一個雙射關係，以方便使用HQL去管理查詢。用於數據分析、清洗 Hive適用於離線的數據分析和清洗，延遲較高。

大数据小同学

2020-07-07 00:39:19

HBase数据结构详解

RowKey 與nosql數據庫們一樣,RowKey是用來檢索記錄的主鍵。訪問HBASE table中的行，只有三種方式：通過單個RowKey訪問(get) 通過RowKey的range（正則）(like) 全表掃描(scan

大数据小同学

2020-07-07 00:39:19

HBase MapReduce 详解

通過HBase的相關JavaAPI，我們可以實現伴隨HBase操作的MapReduce過程，比如使用MapReduce將數據從本地文件系統導入到HBase的表中，比如我們從HBase中讀取一些原始數據後使用MapReduce做數據

大数据小同学

2020-07-07 00:39:19

HBase Shell详细操作

基本操作進入HBase客戶端命令行 [liujh@hadoop102 hbase]$ bin/hbase shell 查看幫助命令 hbase(main):001:0> help 查看當前數據庫中有哪些表 hba

大数据小同学

2020-07-07 00:39:19

Spark读写HBase数据

1.使用Spark創建Hbase表，以及定義表屬性 object HBaseCreateTable { def main(args: Array[String]) { val TABLE_NAME = "test_yu

2020-07-07 00:11:09

数据仓库 - 事实表开发实践（IoT场景）

一、事實表分類 1. 以粒度劃分（1）事務事實表（Transaction Grain Fact Table）一條記錄代表了業務系統中的一個事件。事務出現後，就會在事實中出現一條記錄。以訂單域舉例：下單是一個事實；付款是一個事實；退款

2020-07-06 06:02:15

24小時熱門文章

最新文章

最新評論文章