在數據清洗和轉換過程中,需要把多行按照聚合成一行,下面介紹幾個聚合函數。
特別要注意非聚合字段是null的情況,這是導致聚合字段過長的主要原因。
1.WM_CONCAT()
在11G和12C版本中,這個函數已經失效。
select t.nation,wm_concat(t.city) as citys from a_test group by t.nation;
2.LISTAGG()
這個函數容易出現字符串過長的報錯。
select t.nation,listagg(t.city,',') within group(order by t.city) as citys
from a_test t
group by t.nation;
3.XMLAGG()
select t.nation,rtrim(xmlagg(xmlelement(e,t.city,',').extract('//text()')).getclobval(),',') as citys
from a_test t
group by t.nation;
---結果中的聚合字段是CLOB類型,是文本字符。
---處理400多萬條數據,運行時間是20分鐘
特別要注意非聚合字段是null的情況,這是導致聚合字段過長的主要原因。
select t.nation,xmlagg(xmlparse(content t.city || ','wellformed) order by t.nation).getclobval()
from a_test t
group by t.nation;
---結果彙總的聚合字段也是clob類型,不過是hex字節;
---處理400多萬條數據,運行時間是56秒