ORACLE高效SQL積累

sql語法的分析是從右到左

 

一、sql語句的執行步驟:

1)語法分析,分析語句的語法是否符合規範,衡量語句中各表達式的意義。

2)語義分析,檢查語句中涉及的所有數據庫對象是否存在,且用戶有相應的權限。

3)視圖轉換,將涉及視圖的查詢語句轉換爲相應的對基表查詢語句。

4)表達式轉換, 將複雜的 SQL 表達式轉換爲較簡單的等效連接表達式。

5)選擇優化器,不同的優化器一般產生不同的“執行計劃”

6)選擇連接方式, ORACLE 有三種連接方式,對多表連接 ORACLE 可選擇適當的連接方式。

7)選擇連接順序, 對多表連接 ORACLE 選擇哪一對錶先連接,選擇這兩表中哪個表做爲源數據表。

8)選擇數據的搜索路徑,根據以上條件選擇合適的數據搜索路徑,如是選用全表搜索還是利用索引或是其他的方式。

9)運行“執行計劃”

二、oracle 共享原理:

     ORACLE將執行過的SQL語句存放在內存的共享池(shared buffer pool)中,可以被所有的數據庫用戶共享。

當你執行一個SQL語句(有時被稱爲一個遊標)時,如果它和之前的執行過的語句完全相同,ORACLE就能很快獲得已經被解析的語句以及最好的執行路徑.。這個功能大大地提高了SQL的執行性能並節省了內存的使用。

 

三、oracle 語句提高查詢效率的方法:

1:where column in(select * from ... where ...);

2:... where exists (select 'X' from ...where ...);

 

第二種格式要遠比第一種格式的效率高。

 

在Oracle中可以幾乎將所有的IN操作符子查詢改寫爲使用EXISTS的子查詢。

使用EXIST,Oracle系統會首先檢查主查詢,然後運行子查詢直到它找到第一個匹配項,

這就節省了時間Oracle系統在執行IN子查詢時,首先執行子查詢,並將獲得的結果列表存放在在一個加了索引的臨時表中。

 

避免使用having子句。HAVING 只會在檢索出所有記錄之後纔對結果集進行過濾。

這個處理需要排序,總計等操作。如果能通過WHERE子句限制記錄的數目,那就能減少這方面的開銷。

 

四、SQL Select語句完整的執行順序: 

1、from子句組裝來自不同數據源的數據;

2、where子句基於指定的條件對記錄行進行篩選;

3、group by子句將數據劃分爲多個分組;

4、使用聚集函數進行計算;

5、使用having子句篩選分組;

6、計算所有的表達式;

7、select 的字段;

8、使用order by對結果集進行排序。

SQL語言不同於其他編程語言的最明顯特徵是處理代碼的順序。在大多數據庫語言中,代碼按編碼順序被處理。但在SQL語句中,第一個被處理的子句式FROM,而不是第一齣現的SELECT。SQL查詢處理的步驟序號:

 

1  (8)SELECT  (9) DISTINCT (11) <TOP_specification> <select_list> 

2  (1)  FROM <left_table>  

3  (3) <join_type> JOIN <right_table> 

4  (2) ON <join_condition> 

5  (4) WHERE <where_condition> 

6  (5) GROUP BY <group_by_list> 

7  (6) WITH {CUBE | ROLLUP} 

8  (7) HAVING <having_condition> 

9 (10) ORDER BY <order_by_list>

  

以上每個步驟都會產生一個虛擬表,該虛擬表被用作下一個步驟的輸入。這些虛擬表對調用者(客戶端應用程序或者外部查詢)不可用。只有最後一步生成的表纔會會給調用者。如果沒有在查詢中指定某一個子句,將跳過相應的步驟。

邏輯查詢處理階段簡介:

1、 FROM:對FROM子句中的前兩個表執行笛卡爾積(交叉聯接),生成虛擬表VT1。

2、 ON:對VT1應用ON篩選器,只有那些使爲真才被插入到TV2。

3、 OUTER (JOIN):如果指定了OUTER JOIN(相對於CROSS JOIN或INNER JOIN),保留表中未找到匹配的行將作爲外部行添加到VT2,生成TV3。如果FROM子句包含兩個以上的表,則對上一個聯接生成的結果表和下一個表重複執行步驟1到步驟3,直到處理完所有的表位置。

4、 WHERE:對TV3應用WHERE篩選器,只有使爲true的行才插入TV4。

5、 GROUP BY:按GROUP BY子句中的列列表對TV4中的行進行分組,生成TV5。

6、 CUTE|ROLLUP:把超組插入VT5,生成VT6。

7、 HAVING:對VT6應用HAVING篩選器,只有使爲true的組插入到VT7。

8、 SELECT:處理SELECT列表,產生VT8。

9、 DISTINCT:將重複的行從VT8中刪除,產品VT9。

10、ORDER BY:將VT9中的行按ORDER BY子句中的列列表順序,生成一個遊標(VC10)。

11、TOP:從VC10的開始處選擇指定數量或比例的行,生成表TV11,並返回給調用者。

 

Oracle中SQL語句執行過程中,Oracle內部解析原理如下:

  1、當一用戶第一次提交一個SQL表達式時,Oracle會將這SQL進行Hard parse,這過程有點像程序編譯,檢查語法、表名、字段名等相關信息(如下圖),這過程會花比較長的時間,因爲它要分析語句的語法與語義。然後獲得最優化後的執行計劃(sql plan),並在內存中分配一定的空間保存該語句與對應的執行計劃等信息。

 

  2、當用戶第二次請求或多次請求時,Oracle會自動找到先前的語句與執行計劃,而不會進行Hard parse,而是直接進行Soft parse(把語句對應的執行計劃調出,然後執行),從而減少數據庫的分析時間。

 

  注意的是:Oracle中只能完全相同的語句,包大小寫、空格、換行都要求一樣時,纔會重複使用以前的分析結果與執行計劃。

 

  分析過程如下圖:


對於大量的、頻繁訪問的SQL語句,如果不採用Bind 變量的方式,哪Oracle會花費大量的Shared latch與CPU在做Hard parse處理,所以,要儘量提高語句的重用率,減少語句的分析時間,通過了解Oracle SQL語句的分析過程可以明白Oracle的內部處理邏輯,並在設計與實現上避免。

 

在用JDBC或其它持久化數據(如Hibernate,JDO等)操作時,儘量用佔位符(?)

 

ORACLE sql 的處理過程大致如下:

 1.運用HASH算法,得到一個HASH值,這個值可以通過V$SQLAREA.HASH_VALUE 查看

 2.到shared pool 中的 library cache 中查找是否有相同的HASH值,如果存在,則無需硬解析,進行軟解析

 3.如果shared pool不存在此HASH值,則進行語法檢查,查看是否有語法錯誤

 4.如果沒有語法錯誤,就進行語義檢查,檢查該SQL引用的對象是否存在,該用戶是否具有訪問該對象的權限

 5.如果沒有語義錯誤,對該SQL進行解析,生成解析樹,執行計劃

 6.生成ORACLE能運行的二進制代碼,運行該代碼並且返回結果給用戶

硬解析和軟解析都在第5步進行

硬解析通常是昂貴的操作,大約佔整個SQL執行的70%左右的時間,硬解析會生成執行樹,執行計劃,等等。

當再次執行同一條SQL語句的時候,由於發現library cache中有相同的HASH值,這個時候不會硬解析,而會軟解析,

那麼軟解析究竟是幹了什麼呢?其實軟解析就是跳過了生成解析樹,生成執行計劃這個耗時又耗CPU的操作,直接利用生成的執行計劃運行

該SQL語句。

下面摘抄eygle深入解析ORACLE 中關於SQL執行過程的描述

  1.首先獲得library cache latch,根據SQL的HASH_VALUE在library cache中查找是否存在此HASH_VALUE,如果找到這個HASH_VALUE,稱之爲軟解析,Server獲得改SQL執行計劃轉向第4步,如果找不到共享代碼就進行硬解析。

  2.釋放library pool cache,獲得shared pool latch,查找並鎖定自由空間(在bucket 中查找chunk)。如果找不到,報ORA-04031錯誤。

  3.釋放shared pool latch,重新獲得library cache latch,將SQL執行計劃放入library cache中。

  4.釋放library cache latch,保持null模式的library cache pin/lock。

  5.開始執行。

Library cache latch可以理解爲硬/軟解析的時候發生的,因爲解析的時候會搜索library cache,所以會產生library cache latch

Library cache pin 是在執行的階段發生的。


1、分頁查詢:

--1:無ORDER BY排序的寫法。(效率最高)
--(經過測試,此方法成本最低,只嵌套一層,速度最快!即使查詢的數據量再大,也幾乎不受影響,速度依然!)

SELECT *

  FROM (SELECT ROWNUM AS rowno, t.*

          FROM emp t

         WHERE hire_date BETWEEN TO_DATE ('20060501', 'yyyymmdd')

                             AND TO_DATE ('20060731', 'yyyymmdd')

           AND ROWNUM <= 20) table_alias

 WHERE table_alias.rowno >= 10;

--2:有ORDER BY排序的寫法。(效率最高)
--(經過測試,此方法隨着查詢範圍的擴大,速度也會越來越慢哦!)

SELECT *

  FROM (SELECT tt.*, ROWNUM AS rowno

          FROM (  SELECT t.*

                    FROM emp t

                   WHERE hire_date BETWEEN TO_DATE ('20060501', 'yyyymmdd')

                                       AND TO_DATE ('20060731', 'yyyymmdd')

                ORDER BY create_time DESC, emp_no) tt

         WHERE ROWNUM <= 20) table_alias

 WHERE table_alias.rowno >= 10;



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章