一:前言
Index對數據庫性能有着舉足輕重的作用。Index設計的優劣直接影響到DB執行的效率。所以在做DB Tuning時,一部分會從Index着手處理,SQL Server也提供了很好的工具Database Engine Tuning Advisor,會給出一些建Index和優化方面的建議。
二:Index概述
這方面在各個博客論壇上面已經講的比較多了,在此大致總結一下:
1. 數據表的基本結構
當建立一個新表時,系統將在磁盤中分配一段以8K爲單位的連續空間;當第一個8K用完的時候,SQL Server指針會自動分配8K的空間。每個8K空間成爲一個數據頁(Page),又稱頁面或者數據頁面,並分配0-7的頁號,每個文件的第0頁記錄引導信息,叫文件頭(File Header);每8個數據頁(64K)的組合形成擴展區(Extent),成爲擴展。全部的數據頁的組合形成堆(Heap)。
2. 索引的基本概念
建立索引的目的就是提高數據檢索效率,改善數據庫工作性能,提高數據訪問速度。系統表sysindexes存儲Index的重要信息。以B-Tree爲存儲結構。
3. 數據表掃描與索引的使用
沒有索引時,訪問表的數據時按照Table Scan,平均效率比較低。
建立索引時,訪問表的數據時按照Index Scan/Seek,平均效率很高。
4. 聚集索引和非聚集索引(Clustered Index and Non Clustered Index)
相同點:
- 以B-Tree爲存儲結構存放的一組數據頁
- 不同階的節點包含指向另一個階的數據頁
- 子節點包含所有的鍵值
- 在sysindexes中可以找到索引的大小和內容分佈
- 都會提高數據查詢的效率
不同點:
- 葉子節點存放什麼:聚集索引存放實際的數據頁;非聚集索引存放指針
注意:子葉層級存放的內容不一樣。
5. 覆蓋索引(Covering Index)
索引覆蓋是指建索引的字段正好是覆蓋查詢條件中所涉及的字段,這裏需要注意的是,必須是從第一個開始覆蓋。
6. 死鎖(DackLock)
請參照
http://www.cnblogs.com/changbluesky/archive/2010/06/10/1753021.html
三:性能簡述(Performance)
1. Index碎片
1.1 查詢碎片
sys.dm_db_index_physical_stats可以用來檢測特定索引、表或索引視圖的所有索引、數據庫中所有索引或所有數據庫中所有索引中的碎片。
重要欄位:
avg_fragmentation_in_percent | 邏輯碎片(索引中的無序頁)的百分比 |
fragment_count | 索引中的碎片(物理上連續的葉頁)數量 |
avg_fragment_size_in_pages | 索引中一個碎片的平均頁數 |
1.2. 重建索引與重組索引(rebuild and reorganize)
無論何時對基礎數據執行插入、更新或刪除操作,SQL Server 數據庫引擎都會自動維護索引。隨着時間的推移,這些修改可能會導致索引中的信息分散在數據庫中(含有碎片)。當索引包含的頁中的邏輯排序(基於鍵值)與數據文件中的物理排序不匹配時,就存在碎片。碎片非常多的索引可能會降低查詢性能,導致應用程序響應緩慢。通過重新組織索引或重新生成索引來修復索引碎片,提高性能。
- ALTER INDEX IX_IndexName ON dbo.TableName REBUILD WITH (ONLINE=ON)
- ALTER INDEX IX_IndexName ON dbo.TableName REORGANIZE
兩種方法的區別:
- 重新組織索引是通過對葉頁進行物理重新排序,使其與葉節點的邏輯順序(從左到右)相匹配,從而對錶或視圖的聚集索引和非聚集索引的葉級別進行碎片整理。
- 重新生成索引將刪除該索引並創建一個新索引。此過程中將刪除碎片,通過使用指定的或現有的填充因子設置壓縮頁來回收磁盤空間,並在連續頁中對索引行重新排序(根據需要分配新頁)。這樣可以減少獲取所請求數據所需的頁讀取數,從而提高磁盤性能。
建議根據碎片程度,使用修復碎片的最佳方法:
2. 選擇正確而的Index
2.1 主要的考量
以範圍查詢
常常需要排序的數據
2.2 次要考量
欄位長度要短
- 會影響所有的非聚集索引
- 非聚集索引的子也曾都包含所有聚集索引的鍵值
數據的類型
3.建立索引的方針
所有SQL語法的優先性
優先建立多個查詢語法可以共通使用的索引
建立符合索引時,最佳的欄位順序
四:總結
與書中的索引一樣,數據庫中的索引使您可以快速找到表或索引視圖中的特定信息。索引包含從表或視圖中一個或多個列生成的鍵,以及映射到指定數據的存儲位置的指針。通過創建設計良好的索引以支持查詢,可以顯著提高數據庫查詢和應用程序的性能。索引可以減少爲返回查詢結果集而必須讀取的數據量。索引還可以強制表中的行具有唯一性,從而確保表數據的數據完整性。
設計良好的索引可以減少磁盤 I/O 操作,並且消耗的系統資源也較少,查詢優化器也能夠很好的利用索引,提高查詢性能。
原載地址:http://www.cnblogs.com/changbluesky/archive/2010/09/06/1819314.html