sql 語句 優化

1、SQL SERVER 2005的性能工具中有SQL Server Profiler和數據庫引擎優化顧問,極好的東東,必須熟練使用。 

2、查詢SQL語句時打開“顯示估計的執行計劃”,分析每個步驟的情況 

3、初級做法,在CPU佔用率高的時候,打開SQL Server Profiler運行,將跑下來的數據存到文件中,然後打開數據庫引擎優化顧問調用那個文件進行分析,由SQL SERVER提供索引優化建議。採納它的INDEX索引優化部分。 

4、但上面的做法經常不會跑出你所需要的,在最近的優化過程中CPU佔用率極高,但根本提不出我需要的優化建議,特別是有些語句是在存儲過程中並且多表聯立。這時就需要用中級做法來定位佔用CPU高的語句。 

5、還是運行SQL Server Profiler,將運行結果保存到某個庫的新表中(隨便起個名字系統會自己建)。讓它運行一段時間,然後可以用 
select top 100 * from test where textdata is not null order by duration desc 
這個可以選出運行時間長的語句,在ORDER BY 中可以替換成CPU、READS,來選出CPU佔用時間長和讀數據過多的語句。 
定位出問題的語句之後就可以具體分析了。有些語句在執行計劃中很明顯可以看出問題所在。 
常見的有沒有建索引或索引建立不合理,會出現table scan或index scan,凡是看到SCAN,就意味着會做全表或全索引掃描,這是帶來的必然是讀次數過多。我們期望看到的是seek或鍵查找。 

6、怎麼看SQL語句執行的計劃很有講究,初學者會過於關注裏面顯示的開銷比例,而實際上這個有時會誤導。我在實際優化過程中就被發現,一個index scan的執行項開銷只佔25%,另一個鍵查找的開銷佔50%,而鍵查找部分根本沒有可優化的,SEEK謂詞就是ID=XXX這個建立在主鍵上的查找。而仔細分析可以看到,後者CPU開銷0.00015,I/O開銷0.0013。而前者呢,CPU開銷1.4xxxx,I/O開銷也遠大於後者。因此,優化重點應該放在前者。 

7、如何優化單個部分,一個複雜的SQL語句,SQL SERVER會很聰明地重組WHERE後的語句,試圖匹配索引。選中帶優化的步驟,選擇旁邊的‘屬性”,再選擇其中的“謂詞”,將其中部分複製下來,這部分就是分解後的WHERE 語句,然後在查詢界面中select * from 表 where 剛纔複製下來的“謂詞”。這個就是需要優化的部分,既然已經走到這一步了,大部分人應該能手動建立索引了,因爲這裏的WHERE語句比之前的肯定簡單不少。(在我項目中原始SELECT語句的WHERE部分有10個條件組合,涉及6個字段,提取出來要優化的部分就4個條件,涉及到3個字段。新的索引建立後,CPU佔用率一下子就降低了,而且新建立的索引涉及的字段屬於不常UPDATE的部分,頻繁的讀寫操作不會影響UPDATE的效率) 

8、以上就是優化的思路,最後提一些優化過程或是系統設計時中需要注意的問題。 
A、儘量避免用select * from xxx where abc like '%xxx'類型的模糊查詢,因爲%在前面的話是無法利用到索引,必然會引起全量SCAN操作。應該找尋替代方式或用前置條件語句把like查找之前的行數減到最低。 
B、儘量避免對大表數據進行select top n * from xxx where xxxx order by newid()的取隨機記錄的操作。newid()操作會讀全量數據後再排序。也會佔用大量CPU和讀操作。可以考慮用RAND()函數來實現,這方面我還在研究中,對於整表操作比較好弄,比如id>=(select max(id) from table)*rand()。但如果取局部數據的隨機記錄還需要思量。 
C、在SQL Server Profiler記錄中會看到Audit Logout會佔用大量CPU和讀寫等操作。查了一些資料稱是某個鏈接在某次連接過程中執行SQL語句產生的總數,不用過於擔心。看下來的確似乎這樣,很多Audit Logout的CPU和IO消耗量和之前優化的語句基本一致。所以在第5點我提的SQL語句用textdata is not null條件把Audit Logout給隱去。 
D、兩個不同字段OR語句會導致全表掃描。例如 where m=1 or n=1。如果建立一個索引是m和n,同樣會引起scan,解決方法是給m和n分別建立索引。測試12萬條數據的表,索引建立錯誤的情況下IO開銷高達 10.xxx,分別建立索引後,全部變成0.003,這個反差是非常巨大的。雖然會引起INSERT操作的性能問題,但畢竟大部分瓶頸在SELECT的讀操作上。 
E、索引查找(Index Seek)和索引掃描(Index Scan),我們需要的是前者,而引起後者的原因通常是某個索引裏的字段多餘要查找的,例如索引建立在A和B兩個字段,而我們只要查找A,則會導致 INDEX SCAN。建議針對單獨的A建立索引,以形成索引查找。 
F、對於小表不建議建立索引,特別是幾百的數據量,只有上千上萬級別的數據建立索引纔有效果。 

數據庫優化是很深的學問,在數據庫設計時就應該注意,特別是最後提到的A、B兩點,儘可能在設計初期避免。


最近幾週一直在進行數據庫培訓,老師精湛的技術和生動的講解使我受益匪淺。爲了讓更多的新手受益,我抽空把SQL語句優化部分進行了整理,希望大家一起進步。

一、操作符優化

1、IN 操作符

用IN寫出來的SQL的優點是比較容易寫及清晰易懂,這比較適合現代軟件開發的風格。但是用IN的SQL性能總是比較低的,從Oracle執行的步驟來分析用IN的SQL與不用IN的SQL有以下區別:

ORACLE試圖將其轉換成多個表的連接,如果轉換不成功則先執行IN裏面的子查詢,再查詢外層的表記錄,如果轉換成功則直接採用多個表的連接方式查詢。由此可見用IN的SQL至少多了一個轉換的過程。一般的SQL都可以轉換成功,但對於含有分組統計等方面的SQL就不能轉換了。

推薦方案:在業務密集的SQL當中儘量不採用IN操作符,用EXISTS 方案代替。

2、NOT IN操作符

此操作是強列不推薦使用的,因爲它不能應用表的索引。

推薦方案:用NOT EXISTS 方案代替

3、IS NULL 或IS NOT NULL操作(判斷字段是否爲空)

判斷字段是否爲空一般是不會應用索引的,因爲索引是不索引空值的。

推薦方案:用其它相同功能的操作運算代替,如:a is not null 改爲 a>0 或a>’’等。不允許字段爲空,而用一個缺省值代替空值,如申請中狀態字段不允許爲空,缺省爲申請。

4、> 及 < 操作符(大於或小於操作符)

大於或小於操作符一般情況下是不用調整的,因爲它有索引就會採用索引查找,但有的情況下可以對它進行優化,如一個表有100萬記錄,一個數值型字段A,30萬記錄的A=0,30萬記錄的A=1,39萬記錄的A=2,1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了,因爲A>2時ORACLE會先找出爲2的記錄索引再進行比較,而A>=3時ORACLE則直接找到=3的記錄索引。

5、LIKE操作符

LIKE操作符可以應用通配符查詢,裏面的通配符組合可能達到幾乎是任意的查詢,但是如果用得不好則會產生性能上的問題,如LIKE ‘%5400%’ 這種查詢不會引用索引,而LIKE ‘X5400%’則會引用範圍索引。

一個實際例子:用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描,如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢,性能肯定大大提高。

6、UNION操作符

UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表UNION。如:
select * from gc_dfys
union
select * from ls_jg_dfys
這個SQL在運行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表數據量大的話可能會導致用磁盤進行排序。

推薦方案:採用UNION ALL操作符替代UNION,因爲UNION ALL操作只是簡單的將兩個結果合併後就返回。

select * from gc_dfys
union all
select * from ls_jg_dfys

二、SQL書寫的影響

1、同一功能同一性能不同寫法SQL的影響。

如一個SQL在A程序員寫的爲  Select * from zl_yhjbqk

B程序員寫的爲 Select * from dlyx.zl_yhjbqk(帶表所有者的前綴)

C程序員寫的爲 Select * from DLYX.ZLYHJBQK(大寫表名)

D程序員寫的爲 Select *  from DLYX.ZLYHJBQK(中間多了空格)

以上四個SQL在ORACLE分析整理之後產生的結果及執行的時間是一樣的,但是從ORACLE共享內存SGA的原理,可以得出ORACLE對每個SQL 都會對其進行一次分析,並且佔用共享內存,如果將SQL的字符串及格式寫得完全相同,則ORACLE只會分析一次,共享內存也只會留下一次的分析結果,這不僅可以減少分析SQL的時間,而且可以減少共享內存重複的信息,ORACLE也可以準確統計SQL的執行頻率。

2、WHERE後面的條件順序影響

WHERE子句後面的條件順序對大數據量表的查詢會產生直接的影響。如:
Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1
Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下'
以上兩個SQL中dy_dj(電壓等級)及xh_bz(銷戶標誌)兩個字段都沒進行索引,所以執行的時候都是全表掃描,第一條SQL的dy_dj = '1KV以下'條件在記錄集內比率爲99%,而xh_bz=1的比率只爲0.5%,在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU佔用率明顯比第一條低。

3、查詢表順序的影響

在FROM後面的表中的列表順序會對SQL執行性能影響,在沒有索引及ORACLE沒有對錶進行統計分析的情況下,ORACLE會按表出現的順序進行鏈接,由此可見表的順序不對時會產生十分耗服物器資源的數據交叉。(注:如果對錶進行了統計分析,ORACLE會自動先進小表的鏈接,再進行大表的鏈接)

三、SQL語句索引的利用

1、操作符優化(同上)

2、對條件字段的一些優化

採用函數處理的字段不能利用索引,如:

substr(hbs_bh,1,4)=’5400’,優化處理:hbs_bh like ‘5400%’

trunc(sk_rq)=trunc(sysdate), 優化處理:sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)

進行了顯式或隱式的運算的字段不能進行索引,如:ss_df+20>50,優化處理:ss_df>30

‘X’ || hbs_bh>’X5400021452’,優化處理:hbs_bh>’5400021542’

sk_rq+5=sysdate,優化處理:sk_rq=sysdate-5

hbs_bh=5401002554,優化處理:hbs_bh=’ 5401002554’,注:此條件對hbs_bh 進行隱式的to_number轉換,因爲hbs_bh字段是字符型。

條件內包括了多個本表的字段運算時不能進行索引,如:ys_df>cx_df,無法進行優化
qc_bh || kh_bh=’5400250000’,優化處理:qc_bh=’5400’ and kh_bh=’250000’

四、其他

ORACLE的提示功能是比較強的功能,也是比較複雜的應用,並且提示只是給ORACLE執行的一個建議,有時如果出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用,一般不建議開發人員應用ORACLE提示,因爲各個數據庫及服務器性能情況不一樣,很可能一個地方性能提升了,但另一個地方卻下降了,ORACLE在SQL執行分析方面已經比較成熟,如果分析執行的路徑不對首先應在數據庫結構(主要是索引)、服務器當前性能(共享內存、磁盤文件碎片)、數據庫對象(表、索引)統計信息是否正確這幾方面分析


如何加快查詢速度?
1、升級硬件  
2、根據查詢條件,建立索引,優化索引、優化訪問方式,限制結果集的數據量。
3、擴大服務器的內存
4、增加服務器CPU個數
5、對於大的數據庫不要設置數據庫自動增長,它會降低服務器的性能
6、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,如果返回不必要的數據,浪費了服務器的I/O資源,加重了網絡的負擔降低性能。如果表很大,在表掃描的期間將表鎖住,禁止其他的聯接訪問表,後果嚴重。
7、查詢時不要返回不需要的行、列
8、用select   top   100   /   10   Percent   來限制用戶返回的行數或者SET   ROWCOUNT來限制操作的行
9、在IN後面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最後面,減少判斷的次數
10、一般在GROUP   BY   HAVING字句之前就能剔除多餘的行,所以儘量不要用它們來做剔除行的工作。他們的執行順序應該如下最優:
      selectWhere字句選擇所有合適的行,Group   By用來分組個統計行,Having字句用來剔除多餘的分組。這樣Group   By   Having的開銷小,查詢快.對於大的數據行進行分組和Having十分消耗資源。如果Group   BY的目的不包括計算,只是分組,那麼用Distinct更快
11、一次更新多條記錄比分多次更新每次一條快,就是說批處理好
MS   SQL   Server查詢優化方法
查詢速度慢的原因很多,常見如下幾種  
 
        1、沒有索引或者沒有用到索引(這是查詢慢最常見的問題,是程序設計的缺陷)  
        2、I/O吞吐量小,形成了瓶頸效應。  
        3、沒有創建計算列導致查詢不優化。  
        4、內存不足  
        5、網絡速度慢  
        6、查詢出的數據量過大(可以採用多次查詢,其他的方法降低數據量)  
        7、鎖或者死鎖(這也是查詢慢最常見的問題,是程序設計的缺陷)  
        8、sp_lock,sp_who,活動的用戶查看,原因是讀寫競爭資源。  
        9、返回了不必要的行和列  
        10、查詢語句不好,沒有優化  
 
        可以通過如下方法來優化查詢  
 
        1、把數據、日誌、索引放到不同的I/O設備上,增加讀取速度,以前可以將Tempdb應放在RAID0上,SQL2000不在支持。數據量(尺寸)越大,提高I/O越重要.  
        2、縱向、橫向分割表,減少表的尺寸(sp_spaceuse)  
        3、升級硬件  
        4、根據查詢條件,建立索引,優化索引、優化訪問方式,限制結果集的數據量。注意填充因子要適當(最好是使用默認值0)。索引應該儘量小,使用字節數小的列建索引好(參照索引的創建),不要對有限的幾個值的字段建單一索引如性別字段  
        5、提高網速;  
        6、擴大服務器的內存,Windows   2000和SQL   server   2000能支持4-8G的內存。配置虛擬內存:虛擬內存大小應基於計算機上併發運行的服務進行配置。運行   Microsoft   SQL   Server?   2000   時,可考慮將虛擬內存大小設置爲計算機中安裝的物理內存的   1.5   倍。如果另外安裝了全文檢索功能,並打算運行   Microsoft   搜索服務以便執行全文索引和查詢,可考慮:將虛擬內存大小配置爲至少是計算機中安裝的物理內存的   3   倍。將   SQL   Server   max   server   memory   服務器配置選項配置爲物理內存的   1.5   倍(虛擬內存大小設置的一半)。  
        7、增加服務器CPU個數;但是必須明白並行處理串行處理更需要資源例如內存。使用並行還是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務,就可以在處理器上運行。例如耽擱查詢的排序、連接、掃描和GROUP   BY字句同時執行,SQL   SERVER根據系統的負載情況決定最優的並行等級,複雜的需要消耗大量的CPU的查詢最適合並行處理。但是更新操作UPDATE,INSERT, DELETE還不能並行處理。  
        8、如果是使用like進行查詢的話,簡單的使用index是不行的,但是全文索引,耗空間。   like   'a%'   使用索引   like   '%a'   不使用索引用   like   '%a%'   查詢時,查詢耗時和字段值總長度成正比,所以不能用CHAR類型,而是VARCHAR。對於字段的值很長的建全文索引。  
        9、DB   Server   和APPLication   Server   分離;OLTP和OLAP分離  
        10、分佈式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器,但它們相互協作分擔系統的處理負荷。這種通過分區數據形成數據庫服務器聯合體的機制能夠擴大一組服務器,以支持大型的多層   Web   站點的處理需要。有關更多信息,參見設計聯合數據庫服務器。(參照SQL幫助文件'分區視圖')  
 
          a、在實現分區視圖之前,必須先水平分區表  
        b、在創建成員表後,在每個成員服務器上定義一個分佈式分區視圖,並且每個視圖具有相同的名稱。這樣,引用分佈式分區視圖名的查詢可以在任何一個成員服務器上運行。系統操作如同每個成員服務器上都有一個原始表的複本一樣,但其實每個服務器上只有一個成員表和一個分佈式分區視圖。數據的位置對應用程序是透明的。  
 
      11、重建索引   DBCC   REINDEX   ,DBCC   INDEXDEFRAG,收縮數據和日誌   DBCC   SHRINKDB,DBCC   SHRINKFILE.   設置自動收縮日誌.對於大的數據庫不要設置數據庫自動增長,它會降低服務器的性能。   在T-sql的寫法上有很大的講究,下面列出常見的要點:首先,DBMS處理查詢計劃的過程是這樣的:  
 
        1、   查詢語句的詞法、語法檢查          
        2、   將語句提交給DBMS的查詢優化器  
        3、   優化器做代數優化和存取路徑的優化  
        4、   由預編譯模塊生成查詢規劃  
        5、   然後在合適的時間提交給系統處理執行  
        6、   最後將執行結果返回給用戶其次,看一下SQL   SERVER的數據存放的結構:一個頁面的大小爲8K(8060)字節,8個頁面爲一個盤區,按照B樹存放。  
 
        12、Commitrollback的區別   Rollback:回滾所有的事物。   Commit:提交當前的事物.   沒有必要在動態SQL裏寫事物,如果要寫請寫在外面如:   begin   tran   exec(@s)   commit   trans   或者將動態SQL   寫成函數或者存儲過程。  
 
        13、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,如果返回不必要的數據,浪費了服務器的I/O資源,加重了網絡的負擔降低性能。如果表很大,在表掃描的期間將表鎖住,禁止其他的聯接訪問表,後果嚴重。  
 
        14、SQL的註釋申明對執行沒有任何影響  
 
        15、儘可能不使用光標,它佔用大量的資源。如果需要row-by-row地執行,儘量採用非光標技術,如:在客戶端循環,用臨時表,Table變量,用子查詢,用Case語句等等。遊標可以按照它所支持的提取選項進行分類:   只進   必須按照從第一行到最後一行的順序提取行。FETCH   NEXT   是唯一允許的提取操作,也是默認方式。可滾動性   可以在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大,他的目的是支持循環。  
 
        有四個併發選項  
 
READ_ONLY:不允許通過遊標定位更新(Update),且在組成結果集的行中沒有鎖。  
 
        OPTIMISTIC   WITH   valueS:樂觀併發控制是事務控制理論的一個標準部分。樂觀併發控制用於這樣的情形,即在打開遊標及更新行的間隔中,只有很小的機會讓第二個用戶更新某一行。當某個遊標以此選項打開時,沒有鎖控制其中的行,這將有助於最大化其處理能力。如果用戶試圖修改某一行,則此行的當前值會與最後一次提取此行時獲取的值進行比較。如果任何值發生改變,則服務器就會知道其他人已更新了此行,並會返回一個錯誤。如果值是一樣的,服務器就執行修改。   選擇這個併發選項OPTIMISTIC   WITH   ROW   VERSIONING:此樂觀併發控制選項基於行版本控制。使用行版本控制,其中的表必須具有某種版本標識符,服務器可用它來確定該行在讀入遊標後是否有所更改。  
        在   SQL   Server   中,這個性能由   timestamp   數據類型提供,它是一個二進制數字,表示數據庫中更改的相對順序。每個數據庫都有一個全局當前時間戳值:@@DBTS。每次以任何方式更改帶有   timestamp   列的行時,SQL   Server   先在時間戳列中存儲當前的   @@DBTS   值,然後增加   @@DBTS   的值。如果某   個表具有   timestamp   列,則時間戳會被記到行級。服務器就可以比較某行的當前時間戳值和上次提取時所存儲的時間戳值,從而確定該行是否已更新。服務器不必比較所有列的值,只需比較   timestamp   列即可。如果應用程序對沒有   timestamp   列的表要求基於行版本控制的樂觀併發,則遊標默認爲基於數值的樂觀併發控制。  
        SCROLL   LOCKS   這個選項實現悲觀併發控制。在悲觀併發控制中,在把數據庫的行讀入遊標結果集時,應用程序將試圖鎖定數據庫行。在使用服務器遊標時,將行讀入遊標時會在其上放置一個更新鎖。如果在事務內打開遊標,則該事務更新鎖將一直保持到事務被提交或回滾;當提取下一行時,將除去遊標鎖。如果在事務外打開遊標,則提取下一行時,鎖就被丟棄。因此,每當用戶需要完全的悲觀併發控制時,遊標都應在事務內打開。更新鎖將阻止任何其它任務獲取更新鎖或排它鎖,從而阻止其它任務更新該行。  
        然而,更新鎖並不阻止共享鎖,所以它不會阻止其它任務讀取行,除非第二個任務也在要求帶更新鎖的讀取。滾動鎖根據在遊標定義的   SELECT   語句中指定的鎖提示,這些遊標併發選項可以生成滾動鎖。滾動鎖在提取時在每行上獲取,並保持到下次提取或者遊標關閉,以先發生者爲準。下次提取時,服務器爲新提取中的行獲取滾動鎖,並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖,並可以保持到一個提交或回滾操作之後。如果提交時關閉遊標的選項爲關,則   COMMIT   語句並不關閉任何打開的遊標,而且滾動鎖被保留到提交之後,以維護對所提取數據的隔離。所獲取滾動鎖的類型取決於遊標併發選項和遊標   SELECT   語句中的鎖提示。  
        鎖提示   只讀   樂觀數值   樂觀行版本控制   鎖定無提示   未鎖定   未鎖定   未鎖定   更新   NOLOCK   未鎖定   未鎖定   未鎖定   未鎖定   HOLDLOCK   共享   共享   共享   更新   UPDLOCK   錯誤   更新   更新   更新   TABLOCKX   錯誤   未鎖定   未鎖定   更新其它   未鎖定   未鎖定   未鎖定   更新   *指定   NOLOCK   提示將使指定了該提示的表在遊標內是隻讀的。  
 
        16、用Profiler來跟蹤查詢,得到查詢所需的時間,找出SQL的問題所在;用索引優化器優化索引  
 
        17、注意UNionUNion   all   的區別。UNION   all好  
 
        18、注意使用DISTINCT,在沒有必要時不要用,它同UNION一樣會使查詢變慢。重複的記錄在查詢裏是沒有問題的  
 
        19、查詢時不要返回不需要的行、列  
 
        20、用sp_configure   'query   governor   cost   limit'或者SET   QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時,服務器自動取消查詢,在查詢之前就扼殺掉。 SET   LOCKTIME設置鎖的時間  
21、用select   top   100   /   10   Percent   來限制用戶返回的行數或者SET   ROWCOUNT來限制操作的行  
 
        22、在SQL2000以前,一般不要用如下的字句:   "IS   NULL",   " <> ",   "!=",   "!> ",   "! <",   "NOT",   "NOT   EXISTS",   "NOT   IN",   "NOT   LIKE",   and   "LIKE   '%500'",因爲他們不走索引全是表掃描。也不要在WHere字句中的列名加函數,如Convertsubstring等,如果必須用函數的時候,創建計算列再創建索引來替代.還可以變通寫法:WHERE   SUBSTRING(firstname,1,1)   =   'm'改爲WHERE   firstname   like   'm%'(索引掃描),一定要將函數和列名分開。並且索引不能建得太多和太大。NOT   IN會多次掃描表,使用EXISTS、NOT   EXISTS   ,IN   ,   LEFT   OUTER   JOIN   來替代,特別是左連接,而Exists比IN更快,最慢的是NOT操作.如果列的值含有空,以前它的索引不起作用,現在2000的優化器能夠處理了。相同的是IS   NULL,“NOT",   "NOT   EXISTS",   "NOT   IN"能優化她,而” <> ”等還是不能優化,用不到索引。  
 
        23、使用Query   Analyzer,查看SQL語句的查詢計劃和評估分析是否是優化的SQL。一般的20%的代碼佔據了80%的資源,我們優化的重點是這些慢的地方。  
 
        24、如果使用了IN或者OR等時發現查詢沒有走索引,使用顯示申明指定索引:   SELECT   *   FROM   PersonMember   (INDEX   =   IX_Title)   WHERE   processid   IN   (‘男’,‘女’)  
 
          25、將需要查詢的結果預先計算好放在表中,查詢的時候再SELECT。這在SQL7.0以前是最重要的手段。例如醫院的住院費計算。  
 
        26、MIN()   和   MAX()能使用到合適的索引  
 
        27、數據庫有一個原則是代碼離數據越近越好,所以優先選擇Default,依次爲Rules,Triggers,   Constraint(約束如外健主健CheckUNIQUE……,數據類型的最大長度等等都是約束),Procedure.這樣不僅維護工作小,編寫程序質量高,並且執行的速度快。  
 
        28、如果要插入大的二進制值到Image列,使用存儲過程,千萬不要用內嵌INsert來插入(不知JAVA是否)。因爲這樣應用程序首先將二進制值轉換成字符串(尺寸是它的兩倍),服務器受到字符後又將他轉換成二進制值.存儲過程就沒有這些動作:   方法:Create   procedure   p_insert   as   insert   into   table(Fimage)   values   (@image),   在前臺調用這個存儲過程傳入二進制參數,這樣處理速度明顯改善。  
 
            29、Between在某些時候比IN速度更快,Between能夠更快地根據索引找到範圍。用查詢優化器可見到差別。   select   *   from   chineseresume   where   title   in   ('男','女')   Select   *   from   chineseresume   where   between   '男'   and   '女'   是一樣的。由於in會在比較多次,所以有時會慢些。  
 
          30、在必要是對全局或者局部臨時表創建索引,有時能夠提高速度,但不是一定會這樣,因爲索引也耗費大量的資源。他的創建同是實際表一樣。  
 
        31、不要建沒有作用的事物例如產生報表時,浪費資源。只有在必要使用事物時使用它。  
        
        32、用OR的字句可以分解成多個查詢,並且通過UNION   連接多個查詢。他們的速度只同是否使用索引有關,如果查詢需要用到聯合索引,用UNION   all執行的效率更高.多個OR的字句沒有用到索引,改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。  
 
        33、儘量少用視圖,它的效率低。對視圖操作比直接對錶操作慢,可以用stored   procedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增加了尋找原始資料的難度。我們看視圖的本質:它是存放在服務器上的被優化好了的已經產生了查詢規劃的SQL。對單個表檢索數據時,不要使用指向多個表的視圖,直接從表檢索或者僅僅包含這個表的視圖上讀,否則增加了不必要的開銷,查詢受到干擾.爲了加快視圖的查詢,MsSQL增加了視圖索引的功能。  
 
        34、沒有必要時不要用DISTINCTORDER   BY,這些動作可以改在客戶端執行。它們增加了額外的開銷。這同UNION   UNION   ALL一樣的道理。   SELECT   top   20   ad.companyname,comid,position,ad.referenceid,worklocation,   convert(varchar(10),ad.postDate,120)   as   postDate1,workyear,degreedescription   FROM   jobcn_query.dbo.COMPANYAD_query   ad   where   referenceID   in('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345','JCNAD00333138','JCNAD00303570',   'JCNAD00303569','JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933','JCNAD00254567',   'JCNAD00254585','JCNAD00254608','JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618',   'JCNAD00279196','JCNAD00268613')   order   by   postdate   desc  
 
        35、在IN後面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最後面,減少判斷的次數  
 
        36、當用SELECT   INTO時,它會鎖住系統表(sysobjects,sysindexes等等),阻塞其他的連接的存取。創建臨時表時用顯示申明語句,而不是 select   INTO.   drop   table   t_lxh   begin   tran   select   *   into   t_lxh   from   chineseresume   where   name   =   'XYZ'   --commit   在另一個連接中SELECT   *   from   sysobjects可以看到   SELECT   INTO   會鎖住系統表,Create   table   也會鎖系統表(不管是臨時表還是系統表)。所以千萬不要在事物內使用它!!!這樣的話如果是經常要用的臨時表請使用實表,或者臨時表變量。  
 
        37、一般在GROUP   BY   HAVING字句之前就能剔除多餘的行,所以儘量不要用它們來做剔除行的工作。他們的執行順序應該如下最優:select   Where字句選擇所有合適的行,Group   By用來分組個統計行,Having字句用來剔除多餘的分組。這樣Group   By   Having的開銷小,查詢快.對於大的數據行進行分組和Having十分消耗資源。如果Group   BY的目的不包括計算,只是分組,那麼用Distinct更快  
 
        38、一次更新多條記錄比分多次更新每次一條快,就是說批處理好  
 
        39、少用臨時表,儘量用結果集和Table類性的變量來代替它,Table   類型的變量比臨時表好  
 
        40、在SQL2000下,計算字段是可以索引的,需要滿足的條件如下:  
 
          a、計算字段的表達是確定的  
          b、不能用在TEXT,Ntext,Image數據類型  
        c、必須配製如下選項   ANSI_NULLS   =   ON,   ANSI_PADDINGS   =   ON,   …….  
 
        41、儘量將數據的處理工作放在服務器上,減少網絡的開銷,如使用存儲過程。存儲過程是編譯好、優化過、並且被組織到一個執行規劃裏、且存儲在數據庫中的 SQL語句,是控制流語言的集合,速度當然快。反覆執行的動態SQL,可以使用臨時存儲過程,該過程(臨時表)被放在Tempdb中。以前由於SQL   SERVER對複雜的數學計算不支持,所以不得不將這個工作放在其他的層上而增加網絡的開銷。SQL2000支持UDFs,現在支持複雜的數學計算,函數的返回值不要太大,這樣的開銷很大。用戶自定義函數象光標一樣執行的消耗大量的資源,如果返回大的結果採用存儲過程  
 
        42、不要在一句話裏再三的使用相同的函數,浪費資源,將結果放在變量裏再調用更快  
 
        43、SELECT   COUNT(*)的效率教低,儘量變通他的寫法,而EXISTS快.同時請注意區別:   select   count(Field   of   null)   from   Table   和   select   count(Field   of   NOT   null)   from   Table   的返回值是不同的。  
 
        44、當服務器的內存夠多時,配製線程數量   =   最大連接數+5,這樣能發揮最大的效率;否則使用   配製線程數量 <最大連接數啓用SQL   SERVER的線程池來解決,如果還是數量   =   最大連接數+5,嚴重的損害服務器的性能。  
 
        45、按照一定的次序來訪問你的表。如果你先鎖住表A,再鎖住表B,那麼在所有的存儲過程中都要按照這個順序來鎖定它們。如果你(不經意的)某個存儲過程中先鎖定表B,再鎖定表A,這可能就會導致一個死鎖。如果鎖定順序沒有被預先詳細的設計好,死鎖很難被發現  
 
        46、通過SQL   Server   Performance   Monitor監視相應硬件的負載   Memory:   Page   Faults   /   sec計數器如果該值偶爾走高,表明當時有線程競爭內存。如果持續很高,則內存可能是瓶頸。   Process:  
 
        1、%   DPC   Time   指在範例間隔期間處理器用在緩延程序調用(DPC)接收和提供服務的百分比。(DPC   正在運行的爲比標準間隔優先權低的間隔)。   由於   DPC   是以特權模式執行的,DPC   時間的百分比爲特權時間   百分比的一部分。這些時間單獨計算並且不屬於間隔計算總數的一部   分。這個總數顯示了作爲實例時間百分比的平均忙時。  
        2、%Processor   Time計數器 如果該參數值持續超過95%,表明瓶頸是CPU。可以考慮增加一個處理器或換一個更快的處理器。  
        3、%   Privileged   Time   指非閒置處理器時間用於特權模式的百分比。(特權模式是爲操作系統組件和操縱硬件驅動程序而設計的一種處理模式。它允許直接訪問硬件和所有內存。另一種模式爲用戶模式,它是一種爲應用程序、環境分系統和整數分系統設計的一種有限處理模式。操作系統將應用程序線程轉換成特權模式以訪問操作系統服務)。   特權時間的   %   包括爲間斷和   DPC   提供服務的時間。特權時間比率高可能是由於失敗設備產生的大數量的間隔而引起的。這個計數器將平均忙時作爲樣本時間的一部分顯示。  
        4、%   User   Time表示耗費CPU的數據庫操作,如排序,執行aggregate   functions等。如果該值很高,可考慮增加索引,儘量使用簡單的表聯接,水平分割大表格等方法來降低該值。   Physical   Disk:   Curretn   Disk   Queue   Length計數器該值應不超過磁盤數的1.5~2倍。要提高性能,可增加磁盤。   SQLServer:Cache   Hit   Ratio計數器該值越高越好。如果持續低於80%,應考慮增加內存。   注意該參數值是從SQL   Server啓動後,就一直累加記數,所以運行經過一段時間後,該值將不能反映系統當前值。  
        47、分析select   emp_name   form   employee   where   salary   >   3000   在此語句中若salary是Float類型的,則優化器對其進行優化爲Convert(float,3000),因爲3000是個整數,我們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。同樣字符和整型數據的轉換。
由於SQL優化起來比較複雜,並且還會受環境限制,在開發過程中,寫SQL必須必須要遵循以下幾點的原則: 

  1.ORACLE採用自下而上的順序解析WHERE子句,根據這個原理,表之間的連接必須寫在其他WHERE條件之前, 那些可以過濾掉最大數量記錄的條件必須寫在WHERE子句的末尾. 

  例如: 

  (低效) 

  SELECT … FROM EMP E WHERE SAL > 50000 AND JOB = ‘MANAGER’ AND 25 < (SELECT COUNT(*) FROM EMP WHERE MGR=E.EMPNO); 

  (高效) 

  SELECT … FROM EMP E WHERE 25 < (SELECT COUNT(*) FROM EMP WHERE MGR=E.EMPNO) AND SAL > 50000 AND JOB = ‘MANAGER’; 

  2.SELECT子句中避免使用’*’ 

  當在SELECT子句中列出所有的COLUMN時,使用動態SQL列引用 ‘*’ 是一個方便的方法.可是,這是一個非常低效的方法. 實際上,ORACLE在解析的過程中, 會將’*’ 依次轉換成所有的列名, 這個工作是通過查詢數據字典完成的, 這意味着將耗費更多的時間. 

  3.使用表的別名(Alias) 

  當在SQL語句中連接多個表時, 請使用表的別名並把別名前綴於每個Column上.這樣一來,就可以減少解析的時間並減少那些由Column歧義引起的語法錯誤. 

  注:Column歧義指的是由於SQL中不同的表具有相同的Column名,當SQL語句中出現這個Column時,SQL解析器無法判斷這個Column的歸屬。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章