需求:
今天要統計有有多少家航司數據?要去重
描述:
但是這個字段存的是 以斜槓進行分割的數據
分析:
每個字段都存在重複,或者不重複。整體思想,
1、先在oracle去重,然後以/拼接
2、在java中 寫個程序進行去重拼接
先寫個程序塊:
declare
p_str clob;
begin
for i in (select distinct t.airle
from table_airline
loop
p_str:=p_str||'/'||i.airle;
end loop ;
dbms_output.put_line(p_str);
end;
因爲長度太長,只好設置p_str 爲clob得到:
實際字段長度比這個要長好多,超過了4000個字符,所以很多網上的分割字符都不好寫,又着急要,只好在java中寫下。
/8L/GJ/MU/GJ/MU/ZH/8L/KY/MU/SC/NX/CA/CZ/HU/MU/ZH/CZ/MF/SC/CZ/SC/8L/CZ/GS/HU/JD/PN/QW/SC/Y8
java代碼:
public class TestAirline {
public static void main(String[] arg){
//要去重字符串
String airlines=
"8L/GJ/MU/GJ/MU/ZH/8L/KY/MU/SC/NX/CA/CZ/HU/MU/ZH/CZ/MF/SC/CZ/SC/8L/CZ/GS/HU/JD/PN/QW/SC/Y8/ZH/3U/CZ/GS/HU/JD/MF/PN";
System.out.println(airlines.length());
String[] airlineArr=airlines.split("/");
String airlinedistinct="";
for(int i=0;i<airlineArr.length;i++){
// 如果不包含就拼接
if(!airlinedistinct.contains(airlineArr[i])){
airlinedistinct=airlinedistinct+"/"+airlineArr[i];
}
}
//得到去重航司
System.out.println(airlinedistinct);
//再分割,得到數量
String[] airlinedistinctArr=airlinedistinct.split("/");
System.out.println(airlinedistinctArr.length);
}
}
搞定,當然有更好的方法的話,虛心接受指教。
網上找到一個去重的function (但因爲我拼接的字符串太長,無法使用它的函數)不過以後如果小量的話,還是可以用的下。
如下:
create or replace function fun_rep_repeat_str(p_str varchar2,p_sep varchar2)
return varchar2 deterministic is
/*
*
* 字符串中,子字符串去重
* p_str: 需要去重的字符串
* p_sep: 分隔符
* 例: select fun_rep_repeat_str('100010,100011,100012,100013,100014,100015,100016,100011,100012,100013,100014,100015,100016') from dual;
*/
type v_type is table of varchar2(4000);
v_tab v_type;
v_res varchar2(4000);
cursor c_get_str is
select regexp_substr(p_str, '[^' || p_sep || ']+', 1, level) str
from dual
connect by level <= length(regexp_replace(p_str, '[^' || p_sep || ']')) + 1;
begin
open c_get_str;
fetch c_get_str bulk collect
into v_tab;
close c_get_str;
--集合去重
v_tab := set(v_tab);
for x in 1 .. v_tab.count loop
v_res := v_res || v_tab(x) || p_sep;
end loop;
return rtrim(v_res, p_sep);
end;