HBase初探(二)：Shell命令、布隆过滤器

原創

我小叮当无可奈何

2020-07-07 06:21

一、Shell命令

通用命令

help：查询hbase中所有命令得帮助文档 e.g. help ‘status’
status: 查询当前hbase得集群状态
table_help：引用表得命令

命名空间命令

list_namespace：查询所有得命名空间（默认有hbase,default）
list_namespace_tables：查询命名空间下面的tables
create_namespace：创建namespace
describe_namespace:查询命名空间信息
alter_namespace 修改命名空间
drop_namespace 删除命名空间

DDL命令

create 建表命令 create ‘命名空间:表名’ {name=>‘列簇名’,version=>最多版本号}
list 查询所有表
describe 查询表结构 describe ‘命名空间:表名’
alter 修改表 alter ‘命名空间:表名’,{name=>‘列簇名’}
drop/disable/enable 删除表先让表失效(disable) 然后在删除(drop)

DML命令

put 插入数据 put ‘表名’ ,‘rowkey’,‘列簇：列’，‘value’
scan 扫描表信息
scan ‘t1’,{raw=>true,version=>5} 查询指定版本数据
scan ‘t1’ ,{column =>‘列簇：列名’}查询指定列数据
can ‘t1’ ，{column=>[‘列簇’]，limit=>10 ,startrow =>‘001’} 分页查询
get ‘t1’ ,‘rowkey’ ,‘列簇：列名’ 获取指定表指定列簇的信息
incr ‘t1’,‘005’,'列簇:列’插入一条数据插入的数据的值可以自增长但是数据类型不是String

二、布隆过滤器

定义
Bloom filter 是基于二进制向量的数据结构，具有很好的空间和时间效率。一般用作于检测一个元素是否在一个指定的集合中，如果检测是true,但是不能百分之百保证存在，如果false则必然不存在
应用范围
应用于爬虫中。
在hbase中运用
减少特定的访问模式(get/scan)的查询时间，会少量消耗内存和内存负担
①none:不适用布隆过滤去
②row：行键使用布隆过滤去
③rowcol:行建和列簇使用。细度更细

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

SparkHbase 切分Hfile, 海量数据优化

package cn.jkjf.bigdata.utils.test import cn.jkjf.bigdata.utils.mysql.Global import org.apache.hadoop.conf.Configu

2020-07-07 21:46:19

消费者太多！RocketMQ又炸了！

去年寫過一篇《Topic數量太多！RocketMQ炸了！》，大家評價還不錯。結果，2024年的開頭，我們的RocketMQ又炸了！ 1、問題現象先說明下RocketMQ版本， 4.6.0的老版本了。線下環境客戶端啓動會頻

2024-05-13 12:34:50

HBase Meta 元信息表修复实践

作者：vivo 互聯網大數據團隊 - Huang Guihu、Chen Shengzun HBase是一款開源高可靠、高可擴展性、高性能的分佈式非關係型數據庫，廣泛應用於大數據處理、實時計算、數據存儲和檢索等領域。在分佈式集羣中，硬件故

2024-05-09 12:43:33

MySQL死锁排查，原来我一直没懂。。。

喜大普奔，微信給我的公衆號開了留言功能！！！有緣看到這篇文章的朋友，可以留個言互動下，謝謝～最近線上偶發MySQL的死鎖異常，發現原來很多理論都只背了個結論，細節都是魔鬼。比如，MySQL在RR級別用gap lock防止幻讀，

2024-04-23 23:10:58

倒排索引关键点普及

倒排索引倒排索引是什麼？爲什麼es、hbase、doris、starrocks都有倒排索引？倒排索引（英文：Inverted Index），是一種索引方法，常被用於全文檢索系統中的一種單詞文檔映射結構。現代搜索引擎絕大多數的索引都是基

2024-03-21 00:14:06

究竟什么样的数据库，才能承接RTA广告这个技术活！

本文分享自華爲雲社區《究竟什麼樣的數據庫，才能承接RTA廣告這個技術活！》，作者： GaussDB 數據庫。廣告投放費錢效果差，該如何解？廣告投放是企業宣傳營銷不可或缺的一部分。尤其是在新媒體發展白熱化的當下，不僅廣告渠道多樣化，投放

2024-03-20 10:55:19

菜鸟+Hologres=智能物流

作者：阿里巴巴菜鳥物流團隊（棄疾，孝江，姜繼忠）一、業務背景菜鳥智能物流分析引擎是基於搜索架構建設的物流查詢平臺，日均處理包裹事件幾十億，承載了菜鳥物流數據的大部分處理任務。智能物流分析引擎將基於運配網絡的各類應用場景集中到了統一的一

雲棲號資訊小編

2020-08-17 11:25:47

有哪些大数据处理工具？

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！阿里妹導讀：近幾年裏，大數據行業發展勢頭迅猛，故而相應的分佈式產品和架構層出不窮，本文分享作者在大數據系統實踐過程中接觸過的一些工具及使

雲棲號資訊小編

2020-07-22 12:37:48

dataX从mysql导出数据到hbase

業務數據庫中存了大量的歷史數據，導致在根據業務條件查詢數據的時候效率太低。因此考慮將原始的業務數據通過SQL先做一遍處理後放到中間表，然後再把中間表的數據同步到hbase，以後直接從hbase查詢數據。當然這個還涉及到增量數據如何同步，如

2020-07-08 10:43:37

hbase2.1.6 mr

1.hbase配置mapreduce依賴包編輯Hadoop的hadoop-env.sh文件 2.重啓hbase和Hadoop 上面配置爲hadoop-env.sh後，需要重啓才能生效。 3.在HBASE_HOME下運行命令即可 /v

2020-07-08 10:43:37

hbase2.1.6协处理器使用

對於2.1.6這個版本，使用協處理器需要引入hbase-common依賴。協處理器分爲兩種，一種是observer協處理器，一種是endpoint協處理器。下面首先記錄第一種協處理器的使用步驟。一、observer協處理器案例背景

2020-07-08 10:43:36

hbase为什么能够实现实时读写

首先，需要明確的是，Hbase寫入速度比讀取速度要快，根本原因LSM存儲引擎 Hbase底層的存儲引擎爲LSM-Tree(Log-Structured Merge-Tree)。 LSM核心思想的核心就是放棄部分讀能力，換取寫入的最大化能力

2020-07-08 10:43:36

伪分布Hadoop2.7.6 hbase2.1.8升级到Hadoop3.1.3 hbase2.1.10

如果Hadoop集羣配置了高可用，則可以進行不停服的滾動升級。但現在是僞分佈的單節點集羣，因此需要停止Hadoop及相關的應用，包括hbase、zookeeper等。 Hadoop升級因爲目前有跑flink作業，checkpoint是放

2020-07-08 10:43:24

hbase环境搭建及使用

conf/hbase-env.sh export JAVA_HOME=/data/home/software/jdk1.8.0_202 export HBASE_MANAGES_ZK=false hbase-site.xml <con

fanghailiang2016

2020-07-08 10:12:20

Hbase 之 HBase 的整体架构

HBase 系統架構圖組成部件說明　　Client：　　使用HBase RPC機制與HMaster和HRegionServer進行通信　　Client與HMaster進行通信進行管理類操作　　Client與HRegion

2020-07-08 00:38:07

24小時熱門文章

最新文章

最新評論文章