1、登录伪分布式系统
2、将文件保存在不同的目录中,提高查询的速度,分区假设有一个目录,下边有多个目录,每个目录使用state=1,state=2,state=3如果只查询state=1,只需要查询相应的分区就行,不需要全文查询
3、
sqoop import \
--connect jdbc:mysql://localhost/dualcore \
--username training --password training \
--fields-terminated-by '\t' \
--table suppliers \
--hive-import
sqoop import \
--connect jdbc:mysql://localhost/dualcore \
--username training --password training \
--fields-terminated-by '\t' \
--table employees \
--hive-import
分区表下有很多根据分区字段设置的分区目录
分区字段放在表结构的最后分区字段可以有多个
嵌套分区
区域 邮编 进行划分