1. 基本操作命令
命令 | 含义 | 实例 |
---|---|---|
status | 显示状态 | status ‘hadoop1’ |
whoami | 显示HBase当前用户 | whoami |
list | 显示当前所有表 | list |
count | 统计指定表的记录数 | count ‘user’ |
describe | 显示表的结构信息 | describe ‘user’ |
exists | 检查表是否存在 | exists ‘user’ |
is_enabled/is_disabled | 检查表是否启用/禁用 | is_enabled ‘user’ |
alter | 改变表或列族的模式 | alter ‘user’, NAME => ‘CF2’, VERSIONS => 2 |
disable/enable | 启用/禁用一张表 | disable ‘user’ |
drop | 删除表 | drop ‘user’ |
truncate | 禁用表 | trancate ‘user’ |
-
打开HBase shell
cd /export/servers/hbase-2.0.0 bin/hbase shell
-
创建表,添加数据
# 创建表 create 'user', 'info', 'data' # 向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan put 'user', 'rk0001', 'info:name', 'zhangsan' # 向user表中插入信息,row key为rk0001,列族info中添加gender列标示符,值为female put 'user', 'rk0001', 'info:gender', 'female' # 向user表中插入信息,row key为rk0001,列族info中添加age列标示符,值为20 put 'user', 'rk0001', 'info:age', 20 # 向user表中插入信息,row key为rk0001,列族data中添加pic列标示符,值为picture put 'user', 'rk0001', 'data:pic', 'picture'
-
统计有多少行数据
count 'user'
2. 查询操作
-
通过get查询(get rowkey)
# 获取user表中row key为rk0001的所有信息 get 'user', 'rk0001'
# 获取user表中row key为rk0001,info列族的信息 get 'user', 'rk0001', 'info'
# 获取user表中row key为rk0001,info列族的name、age列标示符的信息 get 'user', 'rk0001', 'info:name', 'info:age'
# 获取user表中row key为rk0001,info、data列族的信息, 两种写法 get 'user', 'rk0001', 'info', 'data' get 'user', 'rk0001', {COLUMN => ['info', 'data']}
#获取user表中row key为rk0001,cell的值为zhangsan的信息 get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
# 获取user表中row key为rk0001,列标示符中含有a的信息 get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}
-
通过scan查询(scan 条件)
get不能得到表中的全部信息,要获取表中的全部信息需要通过scan
# 查询user表中的所有信息 scan 'user'
# 查询user表中列族为info的信息 scan 'user', {COLUMNS => 'info'}
# 查询user表中列族为info和data的信息 scan 'user', {COLUMNS => ['info', 'data']} # 查询user表中列族为info列为name和列族为data列为pic的信息 scan 'user', {COLUMNS => ['info:name', 'data:pic']}
# 查询user表中列族为info、列标示符为name的信息,并且版本最新的5个 scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"} # 查询user表中列族为info,rk范围是[rk0001, rk0003)的数据 scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'} # 查询user表中row key以rk字符开头的 scan 'user',{FILTER=>"PrefixFilter('rk')"}
# 查询user表中指定范围的数据 scan 'user', {TIMERANGE => [1582873430274, 1582873430774]}
3. 更新操作
-
更新数据:操作与插入相同
-
更新版本
# 将user表的f1列族版本号改为5 alter 'user', NAME => 'info', VERSIONS => 5
4. 删除操作
-
指定rowkey以及列名进行删除
# 删除user表row key为rk0001,列标示符为info:name的数据 delete 'user', 'rk0001', 'info:name' scan 'user'
-
指定rowkey,列名以及字段值进行删除
# 删除user表row key为rk0001,列标示符为data:pic,timestamp为1392383705316的数据 delete 'user', 'rk0001', 'data:pic', 1582873430274
-
删除一个列族
alter 'user', NAME => 'info', METHOD => 'delete' 或 alter 'user', 'delete' => 'info'
-
清空表数据
truncate 'user' scan 'user'
-
删除表
# 首先需要先让该表为disable状态 disable 'user' # 删除表 drop 'user' list