oracle優化器(Optimizer)

優化器對於每一位從業人士都不陌生，它是oracle數據庫內置的核心子系統，是數據庫的核心，可以說優化器是數據庫的一個靈魂，它在一定程度上決定了數據庫的效率。

在oracle數據庫中有一個參數OPTIMIZER_MODE控制着該數據庫的優化器模式，我們可以選擇不同方式的優化器。

①RULE

此模式是RBO優化器。

②CHOOSE

oracle 9i中默認的參數，oracle解析SQL使用什麼優化器取決於目標表有沒有統計信息。

③FIRST_ROWS_n（n=1101001000）

改參數值爲1-1101001000之間的任何一個值時，oracle使用CBO優化器，且oracle處理SQL的優先級取決於這個值在這個區間的先後順序。

④FIRST_ROWS

oracle聯合使用CBO和RBO來解析SQL，一般使用CBO解析SQL，且oracle會優先解析該值靠前的SQL文本，如果出現特定情況時使用RBO解析SQL。該參數在9i中已經過時。

⑤ALL_ROWS

oracle10g以後默認的優化器模式，基於成本的優化器，也是目前工作中遇到最多的默認優化器，當然仍然還有些老的系統使用RBO優化器，但不可否認CBO已經佔據了整個oracle數據庫行業。

根據優化器的判斷原則可分爲RBO 和CBO兩種優化器。

RBO(Rule-Based Optimizer)：

RBO是通過oracle數據庫中的硬編碼實現內置的一組判斷規則。所有的目標SQL均是通過該規則生成優化器認爲最優的執行計劃。10g以後oracle建議使用CBO作爲默認優化器。

RBO中將規則分爲15個等級：

Path 1: Single Row by Rowid

Path 2: Single Row by Cluster Join

Path 3: Single Row by Hash Cluster Key with Unique or Primary Key

Path 4: Single Row by Unique or Primary Key

Path 5: Clustered Join

Path 6: Hash Cluster Key

Path 7: Indexed Cluster Key

Path 8: Composite Index

Path 9: Single-Column Indexes

Path 10: Bounded Range Search on Indexed Columns

Path 11: Unbounded Range Search on Indexed Columns

Path 12: Sort Merge Join

Path 13: MAX or MIN of Indexed Column

Path 14: ORDER BY on Indexed Column

Path 15: Full Table Scan

缺陷：

①RBO是通過oracle內部硬編碼來對目標SQL選擇合適的執行計劃，換句話說此方法並沒有考慮到目標表的實際數據量和數據分佈，也沒有考慮到物理設備IO和服務器CPU等相關資源的等待和消耗，僅僅是根據自身的判斷等級來判斷SQL的執行計劃。實際上並不適用所有的系統語句，一旦發生執行計劃選擇問題很難對其作出調整。

②RBO模式下對SQL的書寫要求極高，甚至目標表出現的先後順序不同都會出現不同的執行計劃，這無異於對開發維護人員提出了更高的要求。

③RBO模式下10G以後版本的新特性都不能使用，例如統計信息、直方圖和動態採樣，這些新特性都給CBO選擇最優的實際可行的執行計劃帶來了巨大的幫助。

RBO選錯執行計劃解決方式：

①對SQL中的謂詞條件做字符類型改變。假如一條SQL，我們需要查詢一些數據，而走FULL SCAN的效率要高於INDEX RANG SCAN回表的效率，但是RBO模式下索引等級高於全表掃描等級，會用索引範圍掃描，這是一個很糟糕的執行計劃。我們可以通過修改索引列謂詞的字符類型讓這條SQL不走索引來提高效率。當然此類型改寫方式多種多樣，這裏不再詳細討論。

②RBO中兩個同等級的執行計劃在數據字典中的緩存順序也會影響實際的執行計劃。在RBO中如果一條語句謂詞中涉及兩個索引，但是兩個索引使用的先後順序又嚴重影響SQL的執行效率。爲了使SQL最先走IND_A，可對本來創建較早的IND_A進行重建。RBO會優先使用最新的索引。

③RBO中多表關聯時，執行計劃等級相同的表關聯時，RBO驅動表選擇是從右往左選擇的，即最右側的等級值表爲驅動表。可以通過修改SQL文本中表的順序來調整執行計劃。注意：如果關聯表的等級值不同，無論怎麼調整SQL文本中表的順序都不能改變執行計劃。

④通過hint來強制改變SQL的執行計劃來達到理想的執行效率，這無異於是DBA的終極殺手鐗。

由於在當前生產環境中RBO的環境已經相當罕見了，故這裏不再過多的深入討論。

請注意：oracle中嚴格意義上是沒有驅動表和被驅動表概念的，爲了方便理解這裏引用此概念。

CBO(Cost-Based Optimizer)：

上邊討論了RBO的一些缺陷，顯然RBO已經不能適用當前的生產環境了，從oracle 10G開始oracle默認使用CBO優化器，但是並沒有刪除RBO的相關代碼（依然可以使用），同時爲了強化CBO更明顯突出其中的“成本”，10G以後版本oracle 引入了統計信息和直方圖等新特性。

CBO中的Cost：實際上是根據oracle的相關統計信息計算出來的一個值，包含對應執行步驟的CPU、IO以及部分環境下的網絡消耗成本。CBO認爲減少CPU和IO的消耗是提升SQL執行效率的最重要的方式。

結果集（ROW Source）：是指在施加謂詞之後的結果數量，當一條複雜的SQL進行解析時，CBO會首先對SQL進行查詢轉換改寫SQL爲簡單的SQL文本（關於查詢轉換會在之後詳細討論），每一個簡單的SQL文本都會產生一個結果集，多個結果集進行關聯處理，最終得到的查詢結果即爲最終的結果集。很顯然，此過程的結果集越小，oracle處理該語句的成本越低，執行SQL越高效。

集的勢(Cardinality):CBO特有概念，實際上是對目標SQL具體執行結果集包含數量的估算，這個值影響整條SQL的執行效率，該值越小CBO認爲執行計劃越優。

可選擇率(Selectivity):CBO特有概念，是指施加謂詞條件之後佔未施加謂詞條件的比率，即：0<Selectivity<1。

                施加謂詞的結果集數量（Cardinality）         1

Selectivity=------------------------------------ = -------------

                未施加謂詞的結果集數量（該列總數）      NUM_DISTINCT

顯然該值越小，甚至趨近於0，CBO認爲該執行計劃越優。

從以下實例中可以看到 ROW Source=6 ，Cardinality=Rows=6 Selectivity=Cardinality/總數=6/107

SYS@PROD1>  exec dbms_stats.gather_schema_stats('hr');

PL/SQL procedure successfully completed.

SYS@PROD1> select count(*) from hr.EMPLOYEES;

  COUNT(*)
----------
       107

SYS@PROD1> set autotrace on;
SYS@PROD1> set linesize 200;
SYS@PROD1> select count(*) from hr.EMPLOYEES where SALARY=2500;

  COUNT(*)
----------
         6

Execution Plan
----------------------------------------------------------
Plan hash value: 1756381138

--------------------------------------------------------------------------------
| Id  | Operation          | Name      | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |           |     1 |     4 |     3   (0)| 00:00:01 |
|   1 |  SORT AGGREGATE    |           |     1 |     4 |            |          |
|*  2 |   TABLE ACCESS FULL| EMPLOYEES |     6 |    24 |     3   (0)| 00:00:01 |
--------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   2 - filter("SALARY"=2500)


Statistics
----------------------------------------------------------
          0  recursive calls
          0  db block gets
          7  consistent gets
          0  physical reads
          0  redo size
        422  bytes sent via SQL*Net to client
        420  bytes received via SQL*Net from client
          2  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
          1  rows processed

可傳遞性(Transtivity):CBO特有概念，是在SQL進行查詢轉換時所做的第一件事--對目標SQL進行等價改寫（僅適用於CBO）

①簡單謂詞傳遞.例如：a.id=b.id and b.id=2018，CBO會等價改寫爲a.id=2018。

②連接謂詞傳遞.例如：a.id=b.id and b.id=c.id，CBO會等價改寫爲a.id=c.id。

③外連接謂詞傳遞.例如：a.id=b.id(+) and a.id=2018 ,CBO會等價改寫爲a.id=b.id(+) and a.id=2018 and b.id(+)=2018.

當然CBO也不是很完善，隨着數據市場的複雜性加深，CBO缺陷也逐漸暴露，在實際生產出也出現了諸多問題。

缺陷：

①CBO默認where條件中出現的各個列之間是相互獨立的，沒有關聯關係。CBO會依據這個前提來估算Selectivity、Cardinality，進而生成執行計劃。而現實生產中多表之間並不全完是毫無關聯關係的，從而使產生的執行計劃有較大的偏差。目前緩解此問題的方法是通過動態採樣的方式來解決，但是動態採樣取決於參與動態採樣的數量和質量，而多列統計信息並不適用多表關聯情形。

②CBO會假設所有目標SQL單獨執行互不干擾。SQL語句訪問的索引塊和數據塊可能已經存放在BUFFER CACHE 中，若CBO還按照SQL單獨執行產生執行計劃，則產生執行計劃的Cost會高於實際Cost。

③CBO對直方圖也有諸多限制。

1>oracle 12c之前，Frequency類型的直方圖對應的bucket數量不能超過254，如果目標列distinct 的數量超過254，oracle就會使用 Height Balance類型直方圖，而Height Balance類型直方圖不會記錄所有的nonpoplar value，這種模式下極易選錯執行計劃。在12c以後DBMS_STATS.GATHER_TABLE_STATS函數estimate_percent 參數默認值爲AUTO_SAMPLE_SIZE，若該目標列的NUM_DISTINCE>buskets時就會成爲TOP-Frequency和Hybrid類型的直方圖。

2>oracle數據庫裏針對文本類型的字段收集直方圖時默認將該字段的前32個字符（實際上是15個字符）轉換成浮點數。將該浮點數作爲該列的統計信息存放在DBA_TAB_HISTOGRAMS數據字典中，這就會造成如果一條SQL前邊的字段內容一樣，只有後邊的不一樣時，CBO會認爲是一條SQL進而選錯執行計劃。

④CBO在多表關聯時可能會漏選執行計劃。oracle中幾個甚至十幾個表的關聯語句隨處可見，N個表關聯理論上出現的關聯可能性爲n！，實際上在oracle11g中這種關聯可能性受參數_OPTIMIZER_MAX_PERMUTATIONS所限制，它決定了多表關聯最多的可能性，這種情況下在一些多表關聯時會漏選執行計劃，而漏選的可能就是最優的執行計劃。

統計信息（STATISTICS）

在當前CBO模式下的oracle數據庫中，統計信息就尤爲重要，如果說CBO是一個指揮官，那麼統計信息就好比一個情報官，來定時或者不定時的爲CBO提供最新的情報，使CBO能夠做出正確的判斷。

統計信息實際上是oracle從多個維度描述數據庫對象（記錄數、塊數等）的一組信息，oracle並將該信息存儲在數據字典表中，以供CBO和DBA使用和查閱。ORACLE 10G之後在創建表之後會自動收集統計信息。它可以對錶、索引、列、系統、數據字典和內部對象收集統計信息。

表的統計信息：描述表的記錄數、塊數和平均行長

索引的統計信息：描述索引的深度、數據塊數量、聚簇因子。

列的統計信息：描述列的null、distinct數量。

系統的統計信息：描述服務器系統的處理能力，包含IO和CPU。

數據字典的統計信息：描述數據字典基表（TAB$和IND$）、數據字典基表索引。

內部對象的統計信息：描述數據字典內部表（X$系列表）的詳細信息。

收集統計信息的方法：

①ANALYZE TABLE table_name COMPUTE STATISTICS;

1>對錶employees以估算模式收集統計信息，採樣比例爲15%

analyze table hr.employees estimate statistics sample 15 percent for table;

    SYS@PROD1> analyze table hr.employees estimate statistics sample 15 percent for table;

    Table analyzed.
		
    ***********
    Table Level
    ***********
    
    
    Table                   Number                 Empty Average    Chain Average Global User           Sample Date
    Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
    --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
    EMPLOYEES                  107        5            3   6,505        0      71 NO     NO                107 08-10-2019
    
    Column                    Column                       Distinct          Number     Number Global User           Sample Date
    Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
    ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
    EMPLOYEE_ID               NUMBER(6,0) NOT NULL                                             NO     NO
    FIRST_NAME                VARCHAR2(20)                                                     NO     NO
    LAST_NAME                 VARCHAR2(25) NOT NULL                                            NO     NO
    EMAIL                     VARCHAR2(25) NOT NULL                                            NO     NO
    PHONE_NUMBER              VARCHAR2(20)                                                     NO     NO
    HIRE_DATE                 DATE NOT NULL                                                    NO     NO
    JOB_ID                    VARCHAR2(10) NOT NULL                                            NO     NO
    SALARY                    NUMBER(8,2)                                                      NO     NO
    COMMISSION_PCT            NUMBER(2,2)                                                      NO     NO
    MANAGER_ID                NUMBER(6,0)                                                      NO     NO
    DEPARTMENT_ID             NUMBER(4,0)                                                      NO     NO
    
                                  B                                        Average     Average
    Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
    Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
    --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
    EMP_EMAIL_UK    UNIQUE                                                                                  YES    NO
    EMP_EMP_ID_PK   UNIQUE                                                                                  YES    NO
    EMP_DEPARTMENT_ NONUNIQUE                                                                               YES    NO
    IX
    
    EMP_JOB_IX      NONUNIQUE                                                                               YES    NO
    EMP_MANAGER_IX  NONUNIQUE                                                                               YES    NO
    EMP_NAME_IX     NONUNIQUE                                                                               YES    NO
    
    Index           Column                     Col Column
    Name            Name                       Pos Details
    --------------- ------------------------- ---- ------------------------
    EMP_DEPARTMENT_ DEPARTMENT_ID                1 NUMBER(4,0)
    IX
    
    EMP_EMAIL_UK    EMAIL                        1 VARCHAR2(25) NOT NULL
    EMP_EMP_ID_PK   EMPLOYEE_ID                  1 NUMBER(6,0) NOT NULL
    EMP_JOB_IX      JOB_ID                       1 VARCHAR2(10) NOT NULL
    EMP_MANAGER_IX  MANAGER_ID                   1 NUMBER(6,0)
    EMP_NAME_IX     LAST_NAME                    1 VARCHAR2(25) NOT NULL
                    FIRST_NAME                   2 VARCHAR2(20)

2>只對表以計算模式收集統計信息

analyze table hr.employees compute statistics for table;

    SYS@PROD1> analyze table hr.employees  compute statistics for table;
    
    Table analyzed.

3>對錶列以計算模式收集統計信息

analyze table hr.empoloyees compute statistics for columns EMPLOYEE_ID SALARY;

    SYS@PROD1> analyze table hr.employees  compute statistics for table;

    Table analyzed.

4>對索引以計算模式收集統計信息

analyze index hr.EMP_EMP_ID_PK compute statistics;

    SYS@PROD1> analyze index hr.EMP_EMP_ID_PK compute statistics;
        
    Index analyzed.

5>刪除表所有列、索引的統計信息

analyze table hr.employees delete statistics;

    SYS@PROD1> analyze table hr.employees delete statistics;

    Table analyzed.

6>一次性收集表的所有統計信息

analyze table hr.employees compute statistics;

    SYS@PROD1> analyze table hr.employees compute statistics;
    
    Table analyzed. 
    
    Table                   Number                 Empty Average    Chain Average Global User           Sample Date
    Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
    --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
    EMPLOYEES                  107        5            3   6,505        0      71 NO     NO                107 08-10-2019
    
    Column                    Column                       Distinct          Number     Number Global User           Sample Date
    Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
    ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
    EMPLOYEE_ID               NUMBER(6,0) NOT NULL              107       0       1          0 NO     NO                107 08-10-2019
    FIRST_NAME                VARCHAR2(20)                       91       0       1          0 NO     NO                107 08-10-2019
    LAST_NAME                 VARCHAR2(25) NOT NULL             102       0       1          0 NO     NO                107 08-10-2019
    EMAIL                     VARCHAR2(25) NOT NULL             107       0       1          0 NO     NO                107 08-10-2019
    PHONE_NUMBER              VARCHAR2(20)                      107       0       1          0 NO     NO                107 08-10-2019
    HIRE_DATE                 DATE NOT NULL                      98       0       1          0 NO     NO                107 08-10-2019
    JOB_ID                    VARCHAR2(10) NOT NULL              19       0       1          0 NO     NO                107 08-10-2019
    SALARY                    NUMBER(8,2)                        58       0       1          0 NO     NO                107 08-10-2019
    COMMISSION_PCT            NUMBER(2,2)                         7       0       1         72 NO     NO                107 08-10-2019
    MANAGER_ID                NUMBER(6,0)                        18       0       1          1 NO     NO                107 08-10-2019
    DEPARTMENT_ID             NUMBER(4,0)                        11       0       1          1 NO     NO                107 08-10-2019
    
                                  B                                        Average     Average
    Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
    Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
    --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
    EMP_EMAIL_UK    UNIQUE        0    1            107            107           1           1           19 YES    NO                107 08-10-2019
    EMP_EMP_ID_PK   UNIQUE        0    1            107            107           1           1            2 YES    NO                107 08-10-2019
    EMP_DEPARTMENT_ NONUNIQUE     0    1             11            106           1           1            7 YES    NO                106 08-10-2019
    IX
    
    EMP_JOB_IX      NONUNIQUE     0    1             19            107           1           1            8 YES    NO                107 08-10-2019
    EMP_MANAGER_IX  NONUNIQUE     0    1             18            106           1           1            7 YES    NO                106 08-10-2019
    EMP_NAME_IX     NONUNIQUE     0    1            107            107           1           1           15 YES    NO                107 08-10-2019
    
    Index           Column                     Col Column
    Name            Name                       Pos Details
    --------------- ------------------------- ---- ------------------------
    EMP_DEPARTMENT_ DEPARTMENT_ID                1 NUMBER(4,0)
    IX
    
    EMP_EMAIL_UK    EMAIL                        1 VARCHAR2(25) NOT NULL
    EMP_EMP_ID_PK   EMPLOYEE_ID                  1 NUMBER(6,0) NOT NULL
    EMP_JOB_IX      JOB_ID                       1 VARCHAR2(10) NOT NULL
    EMP_MANAGER_IX  MANAGER_ID                   1 NUMBER(6,0)
    EMP_NAME_IX     LAST_NAME                    1 VARCHAR2(25) NOT NULL
                    FIRST_NAME                   2 VARCHAR2(20)

②EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'owner',TABNAME=>'table_name');

1>收集表的統計信息

EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES');

2>以估算方式收集表的統計信息，採樣比例爲15%

EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES',ESTIMATE_PERCENT=>15,METHOD_OPT=>'FOR TABLE',CASCADE=>FALSE);

METHOD_OPT=>'FOR TABLE'並不適用所有的oracle版本。估算模式的採樣比例改爲100或者null，就是以計算模式收集統計信息。

    SYS@PROD1> EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES',ESTIMATE_PERCENT=>15,METHOD_OPT=>'FOR TABLE',CASCADE=>FALSE);
    SYS@PROD1> 
    
    Table                   Number                 Empty Average    Chain Average Global User           Sample Date
    Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
    --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
    EMPLOYEES                  107        5            0       0        0      69 YES    NO                107 08-10-2019
    
    Column                    Column                       Distinct          Number     Number Global User           Sample Date
    Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
    ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
    EMPLOYEE_ID               NUMBER(6,0) NOT NULL                                             NO     NO
    FIRST_NAME                VARCHAR2(20)                                                     NO     NO
    LAST_NAME                 VARCHAR2(25) NOT NULL                                            NO     NO
    EMAIL                     VARCHAR2(25) NOT NULL                                            NO     NO
    PHONE_NUMBER              VARCHAR2(20)                                                     NO     NO
    HIRE_DATE                 DATE NOT NULL                                                    NO     NO
    JOB_ID                    VARCHAR2(10) NOT NULL                                            NO     NO
    SALARY                    NUMBER(8,2)                                                      NO     NO
    COMMISSION_PCT            NUMBER(2,2)                                                      NO     NO
    MANAGER_ID                NUMBER(6,0)                                                      NO     NO
    DEPARTMENT_ID             NUMBER(4,0)                                                      NO     NO
    
                                  B                                        Average     Average
    Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
    Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
    --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
    EMP_EMAIL_UK    UNIQUE                                                                                  NO     NO
    EMP_EMP_ID_PK   UNIQUE                                                                                  NO     NO
    EMP_DEPARTMENT_ NONUNIQUE                                                                               NO     NO
    IX
    
    EMP_JOB_IX      NONUNIQUE                                                                               NO     NO
    EMP_MANAGER_IX  NONUNIQUE                                                                               NO     NO
    EMP_NAME_IX     NONUNIQUE                                                                               NO     NO
    
    Index           Column                     Col Column
    Name            Name                       Pos Details
    --------------- ------------------------- ---- ------------------------
    EMP_DEPARTMENT_ DEPARTMENT_ID                1 NUMBER(4,0)
    IX
    
    EMP_EMAIL_UK    EMAIL                        1 VARCHAR2(25) NOT NULL
    EMP_EMP_ID_PK   EMPLOYEE_ID                  1 NUMBER(6,0) NOT NULL
    EMP_JOB_IX      JOB_ID                       1 VARCHAR2(10) NOT NULL
    EMP_MANAGER_IX  MANAGER_ID                   1 NUMBER(6,0)
    EMP_NAME_IX     LAST_NAME                    1 VARCHAR2(25) NOT NULL
                    FIRST_NAME                   2 VARCHAR2(20)

3>以計算方式對列收集統計信息

EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES',ESTIMATE_PERCENT=>100,METHOD_OPT=>'FOR COLUMNS SIZE 1 EMPLOYEE_ID SALARY',CASCADE=>FALSE);

4>以計算模式收集索引的統計信息

EXEC DBMS_STATS.GATHER_INDEX_STATS(OWNNAME=>'HR',INDNAME=>'EMP_EMP_ID_PK',ESTIMATE_PERCENT=>100);

    SYS@PROD1> EXEC DBMS_STATS.GATHER_INDEX_STATS(OWNNAME=>'HR',INDNAME=>'EMP_EMP_ID_PK',ESTIMATE_PERCENT=>100);		
    
    
    Table                   Number                 Empty Average    Chain Average Global User           Sample Date
    Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
    --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
    EMPLOYEES                  107        5            0       0        0      69 YES    NO                107 08-10-2019
    
    Column                    Column                       Distinct          Number     Number Global User           Sample Date
    Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
    ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
    EMPLOYEE_ID               NUMBER(6,0) NOT NULL              107       0       1          0 YES    NO                107 08-10-2019
    FIRST_NAME                VARCHAR2(20)                                                     NO     NO
    LAST_NAME                 VARCHAR2(25) NOT NULL                                            NO     NO
    EMAIL                     VARCHAR2(25) NOT NULL                                            NO     NO
    PHONE_NUMBER              VARCHAR2(20)                                                     NO     NO
    HIRE_DATE                 DATE NOT NULL                                                    NO     NO
    JOB_ID                    VARCHAR2(10) NOT NULL                                            NO     NO
    SALARY                    NUMBER(8,2)                        58       0       1          0 YES    NO                107 08-10-2019
    COMMISSION_PCT            NUMBER(2,2)                                                      NO     NO
    MANAGER_ID                NUMBER(6,0)                                                      NO     NO
    DEPARTMENT_ID             NUMBER(4,0)                                                      NO     NO
    
                                  B                                        Average     Average
    Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
    Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
    --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
    EMP_EMAIL_UK    UNIQUE                                                                                  NO     NO
    EMP_EMP_ID_PK   UNIQUE        0    1            107            107           1           1            2 YES    NO                107 08-10-2019
    EMP_DEPARTMENT_ NONUNIQUE                                                                               NO     NO
    IX
    
    EMP_JOB_IX      NONUNIQUE                                                                               NO     NO
    EMP_MANAGER_IX  NONUNIQUE                                                                               NO     NO
    EMP_NAME_IX     NONUNIQUE                                                                               NO     NO
    
    Index           Column                     Col Column
    Name            Name                       Pos Details
    --------------- ------------------------- ---- ------------------------
    EMP_DEPARTMENT_ DEPARTMENT_ID                1 NUMBER(4,0)
    IX
    
    EMP_EMAIL_UK    EMAIL                        1 VARCHAR2(25) NOT NULL
    EMP_EMP_ID_PK   EMPLOYEE_ID                  1 NUMBER(6,0) NOT NULL
    EMP_JOB_IX      JOB_ID                       1 VARCHAR2(10) NOT NULL
    EMP_MANAGER_IX  MANAGER_ID                   1 NUMBER(6,0)
    EMP_NAME_IX     LAST_NAME                    1 VARCHAR2(25) NOT NULL
                    FIRST_NAME                   2 VARCHAR2(20)

5>刪除表的統計信息

EXEC DBMS_STATS.DELETE_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES');

6>一次性收集表的所有統計信息

EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES',ESTIMATE_PERCENT=>100,CASCADE=>TRUE);

    SYS@PROD1> EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'HR',TABNAME=>'EMPLOYEES',ESTIMATE_PERCENT=>100,CASCADE=>TRUE);
    
    Table                   Number                 Empty Average    Chain Average Global User           Sample Date
    Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
    --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
    EMPLOYEES                  107        5            0       0        0      69 YES    NO                107 08-10-2019
    
    Column                    Column                       Distinct          Number     Number Global User           Sample Date
    Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
    ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
    EMPLOYEE_ID               NUMBER(6,0) NOT NULL              107       0       1          0 YES    NO                107 08-10-2019
    FIRST_NAME                VARCHAR2(20)                       91       0       1          0 YES    NO                107 08-10-2019
    LAST_NAME                 VARCHAR2(25) NOT NULL             102       0       1          0 YES    NO                107 08-10-2019
    EMAIL                     VARCHAR2(25) NOT NULL             107       0       1          0 YES    NO                107 08-10-2019
    PHONE_NUMBER              VARCHAR2(20)                      107       0       1          0 YES    NO                107 08-10-2019
    HIRE_DATE                 DATE NOT NULL                      98       0       1          0 YES    NO                107 08-10-2019
    JOB_ID                    VARCHAR2(10) NOT NULL              19       0       1          0 YES    NO                107 08-10-2019
    SALARY                    NUMBER(8,2)                        58       0      58          0 YES    NO                107 08-10-2019
    COMMISSION_PCT            NUMBER(2,2)                         7       0       1         72 YES    NO                 35 08-10-2019
    MANAGER_ID                NUMBER(6,0)                        18       0       1          1 YES    NO                106 08-10-2019
    DEPARTMENT_ID             NUMBER(4,0)                        11       0       1          1 YES    NO                106 08-10-2019
    
                                  B                                        Average     Average
    Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
    Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
    --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
    EMP_EMAIL_UK    UNIQUE        0    1            107            107           1           1           19 YES    NO                107 08-10-2019
    EMP_EMP_ID_PK   UNIQUE        0    1            107            107           1           1            2 YES    NO                107 08-10-2019
    EMP_DEPARTMENT_ NONUNIQUE     0    1             11            106           1           1            7 YES    NO                106 08-10-2019
    IX
    
    EMP_JOB_IX      NONUNIQUE     0    1             19            107           1           1            8 YES    NO                107 08-10-2019
    EMP_MANAGER_IX  NONUNIQUE     0    1             18            106           1           1            7 YES    NO                106 08-10-2019
    EMP_NAME_IX     NONUNIQUE     0    1            107            107           1           1           15 YES    NO                107 08-10-2019
    
    Index           Column                     Col Column
    Name            Name                       Pos Details
    --------------- ------------------------- ---- ------------------------
    EMP_DEPARTMENT_ DEPARTMENT_ID                1 NUMBER(4,0)
    IX
    
    EMP_EMAIL_UK    EMAIL                        1 VARCHAR2(25) NOT NULL
    EMP_EMP_ID_PK   EMPLOYEE_ID                  1 NUMBER(6,0) NOT NULL
    EMP_JOB_IX      JOB_ID                       1 VARCHAR2(10) NOT NULL
    EMP_MANAGER_IX  MANAGER_ID                   1 NUMBER(6,0)
    EMP_NAME_IX     LAST_NAME                    1 VARCHAR2(25) NOT NULL
                    FIRST_NAME                   2 VARCHAR2(20)

ANALYZE和DBMS_STATS包的區別：

①ANALYZE不能夠準確收集分區表的統計信息。analyze 只會收集最底層的對象信息，然後彙總出高一層的對象信息，而對於統計信息這樣計算收集肯定會是不準卻的。

例如：

  SYS@PROD1>analyze table sh.sales compute statistics;

  Table                   Number                 Empty Average    Chain Average Global User           Sample Date
  Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
  --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
  SALES                  918,843    1,769          263     472        0      33 NO     NO                  0 08-10-2019
  
  Column                    Column                       Distinct          Number     Number Global User           Sample Date
  Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
  ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
  PROD_ID                   NUMBER(22) NOT NULL                72       0       1          0 NO     NO                    08-10-2019
  CUST_ID                   NUMBER(22) NOT NULL             3,203       0       1          0 NO     NO                    08-10-2019
  TIME_ID                   DATE NOT NULL                   1,460       0       1          0 NO     NO                    08-10-2019
  CHANNEL_ID                NUMBER(22) NOT NULL                 4       0       1          0 NO     NO                    08-10-2019
  PROMO_ID                  NUMBER(22) NOT NULL                 3       0       1          0 NO     NO                    08-10-2019
  QUANTITY_SOLD             NUMBER(10,2) NOT NULL               1       1       1          0 NO     NO                    08-10-2019
  AMOUNT_SOLD               NUMBER(10,2) NOT NULL             867       0       1          0 NO     NO                    08-10-2019
  
                                B                                        Average     Average
  Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
  Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
  --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
  SALES_PROD_BIX  NONUNIQUE     1   32             72          1,074           1           1        1,074 YES    NO                  0 08-10-2019
  SALES_CUST_BIX  NONUNIQUE     1  475          3,203         35,808           1           1       35,808 YES    NO                  0 08-10-2019
  SALES_TIME_BIX  NONUNIQUE     1   59          1,460          1,460           1           1        1,460 YES    NO                  0 08-10-2019
  SALES_CHANNEL_B NONUNIQUE     1   47              4             92           1           1           92 YES    NO                  0 08-10-2019
  IX
  
  SALES_PROMO_BIX NONUNIQUE     1   30              3             54           1           2           54 YES    NO                  0 08-10-2019
  
  Index           Column                     Col Column
  Name            Name                       Pos Details
  --------------- ------------------------- ---- ------------------------
  SALES_CHANNEL_B CHANNEL_ID                   1 NUMBER(22) NOT NULL
  IX
  
  SALES_CUST_BIX  CUST_ID                      1 NUMBER(22) NOT NULL
  SALES_PROD_BIX  PROD_ID                      1 NUMBER(22) NOT NULL
  SALES_PROMO_BIX PROMO_ID                     1 NUMBER(22) NOT NULL
  SALES_TIME_BIX  TIME_ID                      1 DATE NOT NULL
  ....此處分區信息過多 省略....
  
  SYS@PROD1>EXEC DBMS_STATS.GATHER_TABLE_STATS(OWNNAME=>'SH',TABNAME=>'SALES',ESTIMATE_PERCENT=>100,CASCADE=>TRUE);
  
  Table                   Number                 Empty Average    Chain Average Global User           Sample Date
  Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
  --------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
  SALES                  918,843    1,769            0       0        0      29 YES    NO            918,843 08-10-2019
  
  Column                    Column                       Distinct          Number     Number Global User           Sample Date
  Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
  ------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
  PROD_ID                   NUMBER(22) NOT NULL                72       0       1          0 YES    NO            918,843 08-10-2019
  CUST_ID                   NUMBER(22) NOT NULL             7,059       0       1          0 YES    NO            918,843 08-10-2019
  TIME_ID                   DATE NOT NULL                   1,460       0       1          0 YES    NO            918,843 08-10-2019
  CHANNEL_ID                NUMBER(22) NOT NULL                 4       0       1          0 YES    NO            918,843 08-10-2019
  PROMO_ID                  NUMBER(22) NOT NULL                 4       0       1          0 YES    NO            918,843 08-10-2019
  QUANTITY_SOLD             NUMBER(10,2) NOT NULL               1       1       1          0 YES    NO            918,843 08-10-2019
  AMOUNT_SOLD               NUMBER(10,2) NOT NULL           3,586       0       1          0 YES    NO            918,843 08-10-2019
  
                                B                                        Average     Average
  Index                      Tree Leaf       Distinct         Number Leaf Blocks Data Blocks      Cluster Global User           Sample Date
  Name            Unique    Level Blks           Keys        of Rows     Per Key     Per Key       Factor Stats  Stats            Size MM-DD-YYYY
  --------------- --------- ----- ---- -------------- -------------- ----------- ----------- ------------ ------ ------ -------------- ----------
  SALES_PROD_BIX  NONUNIQUE     1   32             72          1,074           1          14        1,074 YES    NO              1,074 08-10-2019
  SALES_CUST_BIX  NONUNIQUE     1  475          7,059         35,808           1           5       35,808 YES    NO             35,808 08-10-2019
  SALES_TIME_BIX  NONUNIQUE     1   59          1,460          1,460           1           1        1,460 YES    NO              1,460 08-10-2019
  SALES_CHANNEL_B NONUNIQUE     1   47              4             92          11          23           92 YES    NO                 92 08-10-2019
  IX
  
  SALES_PROMO_BIX NONUNIQUE     1   30              4             54           7          13           54 YES    NO                 54 08-10-2019
  
  Index           Column                     Col Column
  Name            Name                       Pos Details
  --------------- ------------------------- ---- ------------------------
  SALES_CHANNEL_B CHANNEL_ID                   1 NUMBER(22) NOT NULL
  IX
  
  SALES_CUST_BIX  CUST_ID                      1 NUMBER(22) NOT NULL
  SALES_PROD_BIX  PROD_ID                      1 NUMBER(22) NOT NULL
  SALES_PROMO_BIX PROMO_ID                     1 NUMBER(22) NOT NULL
  SALES_TIME_BIX  TIME_ID                      1 DATE NOT NULL
  
  ....此處分區信息過多 省略....

通過對比以上兩種方式收集分區表sh.sales統計信息可以發現，analyze方式收集統計信息對列distinct的值並不準確，dbms包收集的是準確的。

  SH@PROD1> select table_name,PARTITIONED from user_tables where table_name='SALES';
 
  Table_Name            PAR
  ---------------	---
  SALES          	YES  
  SH@PROD1> select count(*) from sales;
  
    COUNT(*)
  ----------
      918843
  SH@PROD1> select count(distinct CUST_ID) from sales;
  
  COUNT(DISTINCTCUST_ID)
  ----------------------
                    7059
  SH@PROD1> select count(distinct AMOUNT_SOLD) from sales;
  
  COUNT(DISTINCTAMOUNT_SOLD)
  --------------------------
                        3586

②analyze不能夠並行的收集統計信息，隨着數據市場的擴大，在海量數據庫裏收集統計信息的時間無異於是一個值得關注的問題，時間過長會對數據庫性能造成一定的影響，而這一點analyze是不能解決的。

③以上兩點是在實際生產中analyze帶來的明顯缺陷，而這一點dbms_stats包就可以完美的解決（degree=>4開啓並行），這也是在oracle建議使用dbms_stats包收集統計信息的重要原因。

自動收集統計信息：

oracle 10g以前是需要DBA手動寫腳本來收集統計信息的，在oracle 10g中的自動收集統計信息作業爲GATHER_STATS_JOB，實際上是調用dms_stats_internal.update_target_list存儲過程來實現的（失效標準也在其中）。

SYS@PROD1>SELECT JOB_NAME,PROGRAM_NAME,SCHEDULE_NAME FROM DBA_SCHEDULER_JOBS WHERE JOB_NAME='GATHER_STATS_JOB';

JOB_NAME              PROGRAM_NAME                     SCHEDULE_NAME
------------------    ---------------------------      -----------------------------
GATHER_STATS_JOB      GATHER_STATS_PROG                MAINTENANCE_WINDOW_GROUP

SYS@PROD1>select * from dba_scheduler_wingroup_members where window_group_name='MAINTENANCE_WINDOW_GROUP';

WINDOW_GROUP_NAME              WINDOW_NAME
------------------------------ ------------------------------
MAINTENANCE_WINDOW_GROUP       WEEKNIGHT_WINDOW
MAINTENANCE_WINDOW_GROUP       WEEKEND_WINDOW

10g自動作業特點：

①每天通過執行GATHER_STATS_JOB作業來實現，其本質是調用dbms_stats包裏的存儲過程GATHER_DATABASE_STATS_JOB_PROC。

②WEEKEND_WINDOW：工作日運行，每天22點開始，最長8小時。

WEEKNIGHT_WINDOW：週六早晨0點開始，最長24小時。

③沒有資源限制設置，可無限制消耗資源。

10g缺點：

①可配置維護窗口少，不夠靈活。

②沒有資源限制設置，這可能會嚴重影響數據庫的正常業務運行。

11g的自動收集作業：

11g中引入了gather_stats_prog自動任務用來自動收集統計信息，自動任務對應的客戶端名稱爲auto optimizer stats collection。在自動運行任務gather_stats_prog時每次都會先生成ORA$AT_OS_OPT_XXX的作業然後在執行這個作業。

SYS@PROD1> select client_name,task_name,operation_name,status from dba_autotask_task;

CLIENT_NAME                         TASK_NAME                 OPERATION_NAME            STATUS
----------------------------------- ------------------------- ------------------------- --------
sql tuning advisor                  AUTO_SQL_TUNING_PROG      automatic sql tuning task ENABLED
auto space advisor                  auto_space_advisor_prog   auto space advisor job    ENABLED
auto optimizer stats collection     gather_stats_prog         auto optimizer stats job  ENABLED

SYS@PROD1> select * from dba_scheduler_wingroup_members where window_group_name='MAINTENANCE_WINDOW_GROUP';

WINDOW_GROUP_NAME              WINDOW_NAME
------------------------------ ------------------------------
MAINTENANCE_WINDOW_GROUP       MONDAY_WINDOW
MAINTENANCE_WINDOW_GROUP       TUESDAY_WINDOW
MAINTENANCE_WINDOW_GROUP       WEDNESDAY_WINDOW
MAINTENANCE_WINDOW_GROUP       THURSDAY_WINDOW
MAINTENANCE_WINDOW_GROUP       FRIDAY_WINDOW
MAINTENANCE_WINDOW_GROUP       SATURDAY_WINDOW
MAINTENANCE_WINDOW_GROUP       SUNDAY_WINDOW

11g自動作業特點：

①自動運行作業每天通過運行gather_stats_prog來實現，每次都會先生成ORA$AT_OS_OPT_XXX的作業然後在執行這個作業，實際上是調用DBMS_STATS包裏的存儲過程GATHER_DATABASE_STATS_JOB_PROC。

②MONDAY_WINDOW - FRIDAY_WINDOW：每天22點運行，最長4小時；

SATURDAY_WINDOW，SUNDAY_WINDOW：每天6點運行，最長20小時。

③oracle對作業執行施加了資源組：DEFAULT_MAINIENANCE_PLAN。

oracle自動收集統計信息判斷標準：

自上次統計信息收集作業完成之後，若MON_MODS_ALL$中記錄的delete+insert+update記錄數超過TAB$記錄數的10%，或者上次統計信息收集完成後目標表執行過truncate，那麼oracle認爲此時統計信息已失效。

表的統計信息：

表的統計信息實際上是存放在TAB$,TABPART$,TABSUBPART$等數據字典基表中。可以通過DBA_TABLES,DBA_TAB_PARTITIONS,DBA_TAB_SUBPARTITIONS數據字典分別查看統計信息。

TEST@PROD1> create  table ren_test(id number,name varchar2(10));

DECLARE
i number;
BEGIN
FOR i in 1..10000 loop 
INSERT INTO ren_test(ID, NAME) VALUES(10, 'CAP');
COMMIT;
END LOOP;
END;
/
TEST@PROD1> select count(*) from ren_test;

  COUNT(*)
----------
     10000
計算Average row length長度
SYS@PROD1> select dump(10,16) from dual; --2+1（描述）

DUMP(10,16)
-----------------
Typ=2 Len=2: c1,b
SYS@PROD1> select dump('CAP',16) from dual;--3+1（描述）

DUMP('CAP',16)
----------------------
Typ=96 Len=3: 43,41,50     
查看統計信息：  Average Row Len： 3+4=7
SYS@PROD1>  exec dbms_stats.gather_table_stats('test','ren_test');

Table                   Number                 Empty Average    Chain Average Global User           Sample Date
Name                   of Rows   Blocks       Blocks   Space    Count Row Len Stats  Stats            Size MM-DD-YYYY
--------------- -------------- -------- ------------ ------- -------- ------- ------ ------ -------------- ----------
REN_TEST                10,000       20            0       0        0       7 YES    NO             10,000 08-10-2019

Column                    Column                       Distinct          Number     Number Global User           Sample Date
Name                      Details                        Values Density Buckets      Nulls Stats  Stats            Size MM-DD-YYYY
------------------------- ------------------------ ------------ ------- ------- ---------- ------ ------ -------------- ----------
ID                        NUMBER(22)                          1       1       1          0 YES    NO             10,000 08-10-2019
NAME                      VARCHAR2(10)                        1       1       1          0 YES    NO             10,000 08-10-2019

索引的統計信息：

索引的統計信息實際上是存放在IND$,ENDPART$,INDSUBPART$等數據字典基表中。可以通過DBA_INDEXES,DBA_IND_PARTITIONS,DBA_IND_SUBPARTITIONS數據字典分別查看統計信息。

left_block字段存儲的目標索引的葉子塊的數量，CBO通過這個字段來判斷使用什麼索引掃描方式，left_block葉子塊數量越多則索引掃描的成本越高。

通過以下實例可以看出，在數據量減少之後索引重建會減少B tree的深度，oracle中使用索引掃描索引深度也是影響索引效率的一個重要指標。

TEST@PROD1> select owner,table_name,index_name,BLEVEL,LEAF_BLOCKS,DISTINCT_KEYS,CLUSTERING_FACTOR,STATUS,NUM_ROWS,GLOBAL_STATS from dba_indexes where owner='TEST' and table_name='REN_TEST';

                               Table           Index                      Leaf       Distinct      Cluster                  Number Global
OWNER                          Name            Name                BLEVEL Blks           Keys       Factor STATUS          of Rows Stats
------------------------------ --------------- --------------- ---------- ---- -------------- ------------ -------- -------------- ------
TEST                           REN_TEST        IND_ID                   1   20              1           17 VALID            10,000 NO
TEST@PROD1> 
TEST@PROD1> analyze index IND_ID validate structure;
TEST@PROD1> 
TEST@PROD1> select name,height,lf_rows,lf_blks,del_lf_rows from index_stats;

NAME                               HEIGHT    LF_ROWS    LF_BLKS DEL_LF_ROWS
------------------------------ ---------- ---------- ---------- -----------
IND_ID                                  2      10000         20           0  --HEIGHT永遠比BLEVEL值大1
TEST@PROD1> delete from ren_test where id=10;
TEST@PROD1> commit;
TEST@PROD1> insert into ren_test values(100,'ren_1');
TEST@PROD1> commit;
TEST@PROD1> select count(*) from ren_test;

  COUNT(*)
----------
         1
TEST@PROD1> alter index ind_id rebuild;
TEST@PROD1> analyze index IND_ID validate structure;
TEST@PROD1> select name,height,lf_rows,lf_blks,del_lf_rows from index_stats;

NAME                               HEIGHT    LF_ROWS    LF_BLKS DEL_LF_ROWS
------------------------------ ---------- ---------- ---------- -----------
IND_ID                                  1          1          1           0

列的統計信息：

列的統計信息實際上是存放在HIST_HEAD$數據字典基表中。可以通過DBA_TAB_COL_STATISTICS,DBA_PART_COL_STATISTICS,DBA_SUBPART_COL_STATISTICS數據字典分別查看統計信息。

TEST@PROD1> create table test_obj as select * from dba_objects 
  2  ;
TEST@PROD1> select count(*) from test_obj;

  COUNT(*)
----------
     72462

TEST@PROD1> select  low_value ,high_value,num_distinct,num_nulls from  DBA_TAB_COL_STATISTICS where table_name='TEST_OBJ' and owner='TEST';

                                              Distinct     Number
LOW_VALUE            HIGH_VALUE                 Values      Nulls
-------------------- -------------------- ------------ ----------
C103                 C3085250                   72,462          0


TEST@PROD1>  select max(object_ID),dump(max(object_id),16) from test_obj;

MAX(OBJECT_ID)                  DUMP(MAX(OBJECT_ID),16)
------------------------------ ----------------------------------------
   78179                         Typ=2 Len=4: c3,8,52,50    --C3085250
TEST@PROD1> select min(object_ID),dump(min(object_id),16) from test_obj;

MIN(OBJECT_ID   )               DUMP(MIN(OBJECT_ID),16)
------------------------------ ----------------------------------------
      2                          Typ=2 Len=2: c1,3        --C103

數據字典中的LOW_VALUE、HIGH_VALUE分別存儲目標列的最小值和最大值，CBO通過這兩個參數來評估目標SQL在做範圍查詢時的selectivity。

在不考慮直方圖的影響下，目標列的selectivity遵循以下原則：

①column > val ,LOW_VALUE < VAL < HEIGHT_VALUE(範圍查詢時該列>指定的一個值)

selectivity=((HIGH_VALUE - VAL) / (HIGH_VALUE - LOW_VALUE)) * null_adjust