離線大數據項目流程

MapReduce
	數據清洗
hive
textfile格式
create table 表名(
	a string ,
	b string 
)
row format delimited 
fields terminated by "指定分隔符"
stored as textfile;
load data local inpath '本地路徑' into table '表名'
orc格式
create table 表名(
	a string ,
	b string 
)
row format delimited 
fields terminated by "指定分隔符"
stored as orc;
insert into table orc表名 select * from 原始表名;
hql語句執行方式
hive -e "select * from 表名 where 條件" > 寫入文件的路徑

與hbase 關聯
1.創建hive中 的外部表
create external table 表名(
	a string ,
	b string 
)
row format delimited 
fields terminated by "指定分隔符"
stored as textfile;

load data local inpath '本地路徑' into table '表名'
2.hive2hbase
映射表示例
create table hbase中的表名(
a string,
b string
)  
stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'  
with serdeproperties("hbase.columns.mapping" = ":key,列族1:字段1,列族1:字段1") 
tblproperties("hbase.table.name" = "hbase中的表名");

insert overwrite table hbase中的表名 select * from hive中的外部表名
4.phoenix
5.web頁面
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章