數據分佈影響exp條件導出變慢的問題處理

oracle10.2.0.4
AIX5.3

夜間跑批的一個存儲過程,邏輯大致爲數據庫內部先進行數據處理後插入空的導出表,數據處理全部完成後,按照每個表的字段A1進行where條件過濾導出。

在數據處理過程中,由於無意義的嵌套循環,導致對一張表的數據重複的進行I/O讀取。數據量大後,處理變慢,優化需求就提上來了。

例如:

CURSOR cur_a1
is
select code from cura1;
LOOP
select A1 into x_a1 from testa where ta1=cur_a1;
begin
--判斷sequence重置
select count(*) into v_count from sys.dba_objects where object_type='SEQUENCE' AND object_name = 'SEQUENCEname';
IF (v_icount > 0)
THEN
EXECUTE IMMEDIATE 'DROP SEQUENCE SEQUENCEname';
END IF;
EXECUTE IMMEDIATE 'CREATE SEQUENCE SEQUENCEname INCREMENT BY 1 START WITH 1 MINVALUE 1 NOCYCLE NOCACHE NOORDER';
--執行數據插入
insert into table (a1,a2,a3) select a1,SEQUENCEname.NEXTVAL,a3 from A1 where a1=x_a1;

爲何說是無意義循環,在我們的這套環境中,是根據表A中的字段A1中的非重複值數量進行循環,A1字段相等的時候,A2字段取遞增序列SEQ作爲A2字段的值,在每次循環初始,都會重置SEQ。唯一約束爲A1+A2。而A2字段值在程序處理過程中毫無用處。因此計劃取消循環,一次SEQ遞增直到處理完A表,確保A表A2字段值不會重複。

根據這思路,完成了優化,大大提高了數據處理過程的耗時。

但是奇怪的是,就在優化變更做完當天,導出的過程卻離奇的變慢了許多,以至於提高的時間被抹平。

經過分析,發現在優化前和優化後,表的數據分佈情況發生了變化,原先是根據A1字段排序插入A表,而優化後一次生成數據插入A表,忽略了排序,因此導致A1字段索引聚族因子變差。從而影響[exptable=Aquery='whereA1like'1002%']語句的導出效率。

直接加上orderbya1發現報錯:

insert into testa
(a1, a2, a3)
select a1, SEQUENCEname.NEXTVAL, a3 from A order by a1;
ORA - 02287 :sequence number not allowed here

ORACLE有如下限制:
RestrictionsonSequenceValuesYoucannotuseCURRVALandNEXTVALinthe
followingconstructs:
AsubqueryinaDELETE,SELECT,orUPDATEstatement
Aqueryofavieworofamaterializedview
ASELECTstatementwiththeDISTINCToperator
ASELECTstatementwithaGROUPBYclauseorORDERBYclause
ASELECTstatementthatiscombinedwithanotherSELECTstatementwiththeUNION,INTERSECT,orMINUSsetoperator
TheWHEREclauseofaSELECTstatement
TheDEFAULTvalueofacolumninaCREATETABLEorALTERTABLEstatement
TheconditionofaCHECKconstrain

調整語句結構如下:

insert into testa
(a1, a2, a3)
select a1, SEQUENCEname.NEXTVAL, a3
from (select a1, a3 from A order by a1);

順利完成。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章