kylin随笔

1 kylin中一个segment是hbase中的一张表,可以通过修改kylin配置来决定将hbase这张表分为几个regin,以此来提高查询的并发度。

2 增量日期分区表的合并。每天一个cube构建一个segment,存入hbase一张表,可以通过配置定期自动合并。

3 剪枝优化

多个维度的聚合组下面可以通过三种配置来优化,分别为强制维度(必须出现,可以一个或者多个)、层级维度、联合维度(这几个维度要么同时出现,要么同时不出现),可以配置多个聚合组,聚合组典型的应用就是隔离数量特别大的维度(distinct特别多的维度)。

另外不同聚合组下如果出现相同的cubeid,那么kylin自己优化为只计算一次。

4 hbase的rowkey是由group by的维度构成的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章