一、Greenplum 分區原理
分區表意思是將一個大表在物理上分割成幾塊,GPDB中的分區表和PostgreSQL中實現原理一樣,都是用過表繼承、約束來實現。但是與PostgreSQL也有所不同,在PostgreSQL中,一個父表,多個子表來實現分區表,需要手動向子表插入數據,如果向父表插入數據,則直接會被插入到父表中,在GPDB中,可以直接想父表插入數據,便可以根據約束直接自動向對應的子表插入數據,當分區子表不存在時,插入失敗
二、分區表創建
2.1、範圍分區(range)
根據分區字段的值範圍區間來分區,每一個分區就是一個子表
eg:
create table test_partition_range
(
id int,
name varchar(64),
fdate varchar(64)
) distributed by (id)
partition by range(fdate)
(
partition p1 start ('2017-01-01') inclusive end ('2017-01-31') exclusive,
partition p2 start ('2017-02-01') inclusive end ('2017-02-29') exclusive,
default partition default_p
);
inclusive :指定包含,例如上面的 start ('2017-01-01') inclusive 則是包含'2017-01-01'
exclusive : 指定不包含, 例如上面的 end ('2017-01-31') exclusive 則是不包含'2017-01-31'
2.2、快速分區(every)
根據選定的範圍,跨越基數,快速分區每一個子表
eg:
create table test_partition_every_1
(
id int,
name varchar(64),
fdate date
)
distributed by (id)
partition by range (fdate)
(
partition pn_ start ('2017-01-01'::date) end ('2017-12-31'::date) every ('1 day'::interval),
default partition default_p
);
every:指定跨越基數
2.3、list分區(list)
根據值的分組,相同的數據歸類到一組,也就一個分區中
eg:
create table test_partition_list
(
id int,
name varchar(64),
fdate varchar(10)
)
distributed by (id)
partition by list (fdate)
(
partition p1 values ('2017-01-01', '2017-01-02'),
partition p2 values ('2017-01-03'),
default partition pd
);
三、分區相關操作
3.1、分區split
切割普通分區:
將分區p2 在 '2017-02-20' 左右切分成兩塊
alter table test_partition_range split partition p2 at ('2017-02-20') into (partition p2, partition p3);
切割默認分區:
alter table test_partition_range split default partition start ('2017-03-01') end ('2017-03-31') into (partition p4, default partition);
3.2、分區add
如果存在default partition,則不能add分區,只能split default partition
alter table test_partition_range_1 add partition p2 start ('2017-02-01') end ('2017-02-31');
3.3、分區drop
徹底刪除對應的分區表
alter table test_partition_range_1 DROP partition p2;
3.4、分區truncate
清空分區表數據,相當於刪除分區,然後再新建一個
alter table test_partition_range_1 truncate partition p1;
四、子分區創建與操作
4.1、子分區創建
在GPDB中,分區是可以嵌套增加的,分區下面可以有子分區
create table test_partition_range_2
(
id int,
name varchar(64),
fdate varchar(10)
)
distributed by (id)
partition by range(fdate)
subpartition by list(name)
subpartition template
(
subpartition c1 values ('xiaoxiao'),
subpartition c2 values ('xiaohua')
)
(
partition p1 start ('2017-01-01') end ('2017-01-31')
)
上面的分區中,p1會再分兩個c1/c2子分區
4.2、truncate 子分區
alter table test_partition_range_2 alter partition p1 truncate partition c2;
4.3、drop 子分區
alter table test_partition_range_2 alter partition p1 drop partition c2;