索引什麼時候重建和重建方法討論

索引什麼時候需要重建和重建的方法
一提到索引,大家都知道,但是怎樣建索引,什麼時候重建索引,重建索引用什麼方法,可能有的就不太清楚了,我根據一些資料簡單的整理一點,如果哪裏不對或是不妥請大家指點,希望大家有更好經驗也share出來。
索引的目的是爲了加快尋找數據的速度,但是如果對錶經常做改動,則索引也會相應改動,時間長了,查詢速度的效率就會降低,就有可能要重建索引,那麼什麼時候需要重建索引和用什麼方法重建索引可能是大家關心的。
一.        索引在內部進行自身的管理以確保對數據行的快速訪問。但是數據表中大量的活動會導致oracle索引動態地對自身的進行重新配置,這些配置包括三個方面:
1.        索引分割
當新數據行產生的索引節點要建立在現有級別上時,出現此動作。
2.        索引生成
在某些位置,索引達到此級索引的最大容量的時候,就會生成更深一級的索引結構。
3.        索引節點的刪除
你可能瞭解到,刪除表中的數據行後,索引中相應的節點不會從物理意義上刪除,也沒有從索引中刪除此項目。而是從邏輯上刪除此索引項目,並在索引樹中留下了一個“死“節點,當索引刪除了葉節點或是生成了過深的的級別層次後,就需要進行重建。
二  索引的種類:
a.B-tree(B樹)索引
b.壓縮B樹索引
c.Bitmap(位圖)索引
d.函數索引
e.Reverse Key Index(反向鍵索引)
f.Index Organized Table(索引組織表)
三 下面分別對各種索引進行說明
在進行介紹前先說明幾個術語:
   高基數:簡單理解就是表中列的不同值多
   低基數:建單理解就是表中的列的不同值少
   以刪除的葉節點數量:指得是數據行的delete操作從邏輯上刪除的索引節點的數量,要記住oracle在刪除數據行後,將“死“節點保留在索引中,這樣做可以加快sql刪除操作的速度,因此oracle刪除數據行後可以不必重新平衡索引。
   索引高度:索引高度是指由於數據行的插入操作而產生的索引層數,當表中添加大量數據時,oracle將生成索引的新層次以適應加入的數據行,因此,oracle索引可能有4層,但是這隻會出現在索引數中產生大量插入操作的區域。Oracle索引的三層結構可以支持數百萬的項目,而具備4層或是更多層的需要重建。
每次索引訪問的讀取數:是指利用索引讀取一數據行時所需要的邏輯I/O操作數,邏輯讀取不必是物理讀取,因爲索引的許多內容已經保存在數據緩衝區,然而,任何數據大於10的索引都需要重建。
1.        B-tree(B樹)索引
   是現代關係型數據庫中最常用的索引。除了存儲索引數據外,還存儲一個行ID,用來指出該行其餘數據存儲在這個被索引表中的什麼地方。該索引以一種數結構格式存儲這些值。
Oracle建議如果表經過排序,當返回40%一下的數據時使用索引,如果高於40%則使用全表掃描,如果沒有經過排序,則當返回7%以下時,使用索引。看錶是否排序,可以看dba_indexes字典中的CLUSTERING_FACTOR列,如果與表佔用的數據塊數相近,則經過了排序,如果與行數相近,則沒有排序。那麼什麼時候重建呢?我們可以利用analyze index …….. compute statistics 對錶進行分析。然後察看dba_indexes中的blevel。這列是說明索引從根塊到葉快的級別,或是深度。如果級別大於等於4。則需要重建,如下:
Select index_name,blevel from dba_indexes where blevel>=4.
   另一個從重建中受益的指標顯然是當該索引中的被刪除項佔總的項數的百分比。如果在20%以上時,也應當重建,如下
SQL>anlyze index ------ validate structure
SQL>select (del_lf_rows_len/lf_rows_len)*100 from index_stats where name=’------‘
就能看到是否這個索引被刪除的百分比。
上面只是判斷,那麼,怎樣重建會更好呢?
建索引的辦法:
a.        刪除並從頭開始建立索引。
b.        使用alter index -------- rebuild 命令重建索引
c.        使用alter index -------- coalesce命令重建索引。
下面討論一下這三種方法的優缺點:
1).刪除並從頭開始建索引:方法是最慢的,最耗時的。一般不建議。
2).Alter index ---- rebuild 快速重建索引的一種有效的辦法,因爲使用現有索引項來重建新索引,如果客戶操作時有其他用戶在對這個表操作,儘量使用帶online參數來最大限度的減少索引重建時將會出現的任何加鎖問題,alter index ------- rebuild online.但是,由於新舊索引在建立時同時存在,因此,使用這種技巧則需要有額外的磁盤空間可臨時使用,當索引建完後把老索引刪除,如果沒有成功,也不會影響原來的索引。利用這種辦法可以用來將一個索引以到新的表空間。
Alter index ------ rebuild  tablespace -----。
  這個命令的執行步驟如下:
   首先,逐一讀取現有索引,以獲取索引的關鍵字。
   其次,按新的結構填寫臨時數據段。
   最後,一旦操作成功,刪除原有索引樹,降臨時數據段重命名爲新的索引。
   需要注意的是alter index ---rebuild 命令中必須使用tablespace字句,以保證重建工作是在現有索引相同的表空間進行。
3).alter index ----- coalesce 使用帶有coalesce參數時重建期間不需要額外空間,它只是在重建索引時將處於同一個索引分支內的葉塊拼合起來,這最大限度的減少了與查詢過程中相關的潛在的加鎖問題,但是,coalesce選項不能用來講一個索引轉移到其他表空間。
2.壓縮B樹索引
   當B樹索引基於大表時,尤其是當基於數據倉庫或決策支持系統中的大表時,這些索引會耗費大量的存儲空間,壓縮(compressed)B樹索引用來最大限度的減少某些類型的B樹索引使用的空間。當一個B樹索引得到壓縮時,被索引的獵的重複出現就被消除掉,進而減少了存儲索引的總的存儲空間。例如:
壓縮前:smith每次出現還要存儲它的相關的rowid.
姓        關聯rowid
smith        AAABSOAAEAAAABTAAB
smith        AAABSOAAEAAAABTAAC
smith        AAABSOAAEAAAABTAAD
壓縮後:smith項和rowid指存儲一次。
smith        AAABSOAAEAAAABTAAB, AAABSOAAEAAAABTAAB, AAABSOAAEAAAABTAAB
創建方法:
  SQL>create index index_name on  table_name(column_name)
     tablespace tablespace_name
     compress;
另一種方法:
SQL>alter index index_name rebuild compress;
3.        itmap(位圖)索引。
B樹索引在數據具有高基數的列工作的最好,對於低基數的列,位圖索引可能是更有效的選擇。位圖索引創建錶行的一個二進制映像,並把映像存儲在索引塊中,這種類型的索引的DML操作少,長度大並且含有極少不同的值得列特別有用。位圖索引不應當用在頻繁發生insert,update,delete操作的表上,這些dml操作在性能方面的代價很高,因爲,他們會引起位圖級的加鎖發生,而且要求動態的重建所有可能值的位圖。爲圖索引最適合數據倉庫和決策支持系統。
4.        基於函數的索引
當把一個函數運用於被索引的列上時,該列德索引都變得無效,基於函數的索引就是爲了解決這個問題。
5.        反向鍵索引
是一種特殊類型的B樹索引,在索引基於含有序數的列時使非常有用的,如果一個傳統的B樹索引基於一個含有這種數據的列,往往會產生許多級,由於B樹索引有4級以上的深度會降低性能,因此反向鍵索引更適合這種類型,反向鍵索引通過簡單的煩象被索引的列中的數據來解決問題,他首先反向每個列鍵值的字節,然後在反向後的新數據上進行索引,而新數據在值的範圍上的分佈通常比原來的有序數更均勻。
6.        索引組織表
由於B樹、位圖、反向鍵索引的使用而引起的性能將會導致這樣的事實,這些索引中的項目直接指向索引基表中對應數據的行ID,這是從錶行沒有按任何特定的順序來物理地存儲表中檢索錶行的一種有效方法,這種表叫做堆表,oracle大多數表中以一種堆疊方式存儲行數據,因爲行以一種或多或少的隨機方式被分配給表內的塊,之所以出現這種隨機性,是因爲oracle在決定把一個行存儲在何處時並不考慮改行的內容,oracle只是把該行存儲在它從該表的free list 上所發現的第一個塊中。
   如果希望按一種指定順序來存儲一個表的數據,就不能使用堆表,爲此oracle提供了索引組織表,索引組織表不是存儲一個指向行數據的其餘部分存儲在了何處的行的ID指針,而是把行數據全部存儲在索引本身內,這產生了兩個性能好處:
n        錶行按索引順序來存儲。
n        使用B樹索引時引起的先讀取索引後讀取表鎖使用的額外I/O操作得到消除。
例如:
sql>create table emp
  (last_name varchar2(9)  primary key,
   first_name varchar2(9),
   hire_date date)
  organization index tablespace users
pctthreshold 25
including first name
overflow tablespace qyl
mapping table;
所有索引組織表在將要作爲索引基礎的那一列上都必須有一個主鍵約束,索引組織表不能含有唯一性約束或是被聚簇。
下面說明各個參數的含義:
organization index:說明該表是索引組織表
pctthreshold     :指定整個數據塊的什麼百分比要保持打開,以便存儲一個與主鍵值相關聯的行數據,其中主鍵值必須在0到50之間(50是默認值)
including : 指定在行長度超過pctthershold中所設置的大小時按那一列 把行分解成兩段
overflow tablespace :指定在行長度超過pctthreshold中設置的大小時行數的的另一部分存儲到的表空間。
Mapping table:致使在創建索引組織表的位圖索引時所必需的一個關聯映像表的創建。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章