Hive与HBase

什么是Hive:

Hive实际上是一款开源的数据仓库,它是建立在Hadoop基础设施之上的,底层文件系统是HDFS。

什么是HBase:

HBase是一种键值系统的数据库,nosql数据库之一,基于列式存储。它也是基于HDFS。

两者区别:

通过定义就可以清楚知道,Hive是数据仓库,HBase是数据库,两者是有着很大区别的,如:

Hive适合海量数据的挖掘和分析,不支持更新、索引等事务。通过Hive可以使用HQL语言对存放在HDFS文件系统上的数据进行结构化操作。Hive的计算引擎是Hadoop的MapReduce。而HBase适合海量半结构化带时间序列的数据的存储和检索,也就是HBase支持更新、索引等事务。Hbase能够实时运行,其计算引擎由自身提供。

Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目 。

Hive的计算速度比较慢,HBase则具有高效的性能。

Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑。hive需要用到hdfs存储文件,需要用到MapReduce计算框架。HBase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章