ORACLE數據庫的統計數據及其生成方式

ORACLE 數據庫的統計數據及其生成方式

ORACLE 數據庫的 PL/SQL 語句執行的優化器,有基於代價的優化器( CBO )和基於規則的優化器( RBO )。

RBO 的優化方式,依賴於一套嚴格的語法規則,只要按照規則寫出的語句,不管數據表和索引的內容是否發生變化,不會影響 PL/SQL 語句的 " 執行計劃 " 。

CBO 自 ORACLE 7 版被引入, ORACLE 自 7 版以來採用的許多新技術都是隻基於 CBO 的,如星型連接排列查詢,哈希連接查詢,反向索引,索引表,分區表和並行查詢等。 CBO 計算各種可能 " 執行計劃 " 的 " 代價 " ,即 cost ,從中選用 cost 最低的方案,作爲實際運行方案。各 " 執行計劃 " 的 cost 的計算根據,依賴於數據表中數據的統計分佈, ORACLE 數據庫本身對該統計分佈是不清楚的,須要分析表和相關的索引,才能蒐集到 CBO 所需的數據。

CBO 是 ORACLE 推薦使用的優化方式,要想使用好 CBO ,使 SQL 語句發揮最大效能,必須保證統計數據的及時性。

統計信息的生成可以有完全計算法和抽樣估算法。 SQL 例句如下:

完全計算法: analyze table abc compute statistics;

抽樣估算法 ( 抽樣 20%) : analyze table abc estimate statistics sample 20 percent;

對錶作完全計算所花的時間相當於做全表掃描,抽樣估算法由於採用抽樣,比完全計算法的生成統計速度要快,如果不是要求要有精確數據的話,儘量採用抽樣分析法。建議對錶分析採用抽樣估算,對索引分析可以採用完全計算。

我們可以採用以下兩種方法,對數據庫的表和索引及簇表定期分析生成統計信息,保證應用的正常性能。

1. 在系統設置定時任務,執行分析腳本。

在數據庫服務器端,我們以 UNIX 用戶 oracle ,運行腳本 analyze, 在 analyze 中,我們生成待執行 sql 腳本,並運行。(假設我們要分析 scott 用戶下的所有表和索引)

Analyze 腳本內容如下:

sqlplus scott/tiger << EOF

set pagesize 5000

set heading off

SPOOL ANALYTAB.SQL

SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE STATISTICS SAMPLE 20 PERCENT ;' FROM USER_TABLES ;

SPOOL OFF

SPOOL ANALYIND.SQL

SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE STATISTICS SAMPLE 20 PERCENT FOR ALL INDEXES;' FROM USER_TABLES ;

SPOOL OFF

SPOOL ANALYZE.LOG

@ANALYTAB.SQL

@ANALYIND.SQL

SPOOL OFF

EXIT

在 UNIX 平臺上 crontab 加入,以上文件,設置爲每個月或合適的時間段運行。

2. 利用 ORACLE 提供的程序包( PACKAGE )對相關的數據庫對象進行分析。

有以下的程序包可以對錶,索引,簇表進行分析。

包中的存儲過程的相關參數解釋如下:

TYPE 可以是: TABLE , INDEX , CLUSTER 中其一。

SCHEMA 爲: TABLE , INDEX , CLUSTER 的所有者, NULL 爲當前用戶。

NAME 爲:相關對象的名稱。

METHOD 是: ESTIMATE , COMPUTE , DELETE 中其一,當選用 ESTIMATE ,

下面兩項, ESTIMATE_ROWS 和 ESTIMATE_PERCENT 不能同

時爲空值。

ESTIMATE_ROWS 是:估算的抽樣行數。

ESTIMATE_PERCENT 是:估算的抽樣百分比。

METHOD_OPT 是:有以下選項,

FOR TABLE /* 只統計表 */

[FOR ALL [INDEXED] COLUMNS] [SIZE N] /* 只統計有索引的表列 */

FOR ALL INDEXES /* 只分析統計相關索引 */

PARTNAME 是:指定要分析的分區名稱。

1)

DBMS_DDL.ANALYZE_OBJECT(

TYPE VARCHAR2,

SCHEMA VARCHAR2,

NAME VARCHAR2,

METHOD VARCHAR2,

ESTIMATE_ROWS NUMBER DEFAULT NULL,

ESTIMATE_PERCENT NUMBER DEFAULT NULL,

METHOD_OPT VARCHAR2 DEFAULT NULL,

PARTNAME VARCHAR2 DEFAULT NULL ) ;

該存儲過程可對特定的表,索引和簇表進行分析。

例如,對 SCOTT 用戶的 EMP 表,進行 50% 的抽樣分析,參數如下:

DBMS_DDL.ANALYZE_OBJECT('TABLE', 'SCOTT', 'EMP', 'ESTIMATE', NULL,50);

2)

DBMS_UTILITY.ANALYZE_SCHEMA (

SCHEMA VARCHAR2,

METHOD VARCHAR2,

ESTIMATE_ROWS NUMBER DEFAULT NULL,

ESTIMATE_PERCENT NUMBER DEFAULT NULL,

METHOD_OPT VARCHAR2 DEFAULT NULL ) ;

DBMS_UTILITY.ANALYZE_DATABASE (

METHOD VARCHAR2,

ESTIMATE_ROWS NUMBER DEFAULT NULL,

ESTIMATE_PERCENT NUMBER DEFAULT NULL,

METHOD_OPT VARCHAR2 DEFAULT NULL ) ;

其中, ANALYZE_SCHEMA 用於對某個用戶擁有的所有 TABLE , INDEX 和 CLUSTER 的分析統計。

ANALYZE_DATABASE 用於對整個數據庫進行分析統計。

3) DBMS_STATS 是在 ORACLE8I 中新增的程序包,它使統計數據的生成和處理更加靈活方便,並且可以並行方式生成統計數據。在程序包中的以下過程分別分析統計 TABLE , INDEX , SCHEMA , DATABASE 級別的信息。

DBMS_STATS.GATHER_TABLE_STATS

DBMS_STATS.GATHER_INDEX_STATS

DBMS_STATS.GATHER_SCHEMA_STATS

DBMS_STATS.GATHER_DATABASE_STATS

在這裏,我們以數據庫 JOB 的方式,定時對數據庫中 SCOTT 模式下所有的表和索引進行分析:

在 SQL*PLUS 下運行:

VARIABLE jobno number;

BEGIN

DBMS_JOBS.SUBMIT ( :jobno ,

' dbms_utility.analyze_schema ( "scott", "estimate", NULL, 20) ; ',

sysdate, 'sysdate+30');

commit;

end;

/

Statement processed.

Print jobno

JOBNO

-------------

16

以上作業,每隔一個月用 DBMS_UTILITY.ANALYZE_SCHEMA 對用戶 SCOTT 的所有表,簇表和索引作統計分析

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章