BerkeleyDB存儲算法差別


Hash與Btree的區別
當記錄號不是用於數據存取的主鍵時,應該使用 Hash和Btree算法 。 (如果記錄號是用於數據存取的一個二級關鍵字,那麼還是可以選擇Btree算法,因爲它支持一個主鍵和一個記錄號同時存取。)

Btree中的主鍵是有序存儲 ,記錄間的關聯是依靠次序。並且其結構能隨數據的插入和刪除進行動態調整。爲了代碼的簡單,DB沒有實現對關鍵字的前綴碼壓縮。Btree支持對數據查詢、插入、刪除的常數級速度。關鍵字可以爲任意的數據結構。 因此,當在主鍵有序時,Btree算法應該被使用 。例如,如果主鍵是時間戳, 那麼8點時間戳後面跟隨的就是9點時間戳, 這種情況下,Btree算法一般是正確的選擇。再來個例子:如果主鍵是名字,應用需要取出所有同姓的記錄,那麼Btree 存取方法同樣是個好選擇。

Hash 和 Btree 兩種方式在小的數據集合上幾乎沒有性能的差別 。不過,由於Hash使用的是擴展線性HASH算法(extended linear hashing),可以根據HASH表的增長進行適當的調整。所以當一個數據集合足夠大且關鍵字爲隨機分佈時,採用Hash算法比較好

Queue和Recno區別
當用記錄號作爲數據存取的主鍵時,應該使用 Queue和Recno存取方法 。記錄號由算法本身生成。實際上,這和關係型數據庫中邏輯主鍵通常定義爲int AUTO型是同一個概念。兩者基本上都是建立在Btree算法之上,提供存儲有序數據的接口。Queue的優勢在於:由於其記錄爲定長,在插入操作時把記錄插入到隊列的尾部,所以速度最快,而且它執行上鎖和併發處理的水平也相當高。 Recno 的長處在於它支持一些Queue不能實現的特徵,比如可變長記錄和支持flat-text文件。

記錄號可以是可變的或者不變的: 可變指的是當記錄被刪除或者插入記錄號發生變化;不變指的是記錄號無論數據庫如何操作,記錄號都不會發生改變。 基於記錄號存取在Btree方式下也是可行的。但是,記錄號是可變,當記錄刪除或插入時,數據庫內的其他記錄的記錄號都將發生改變。 Queue存取方法總是用固定的方式運行,不管數據庫如何操作,記錄號始終改變。 Recno 可以被設置爲不變和可變兩種形式。

另外,Recno爲數據庫提供支持flat-text文件的永久存儲和數據在讀或修改時提供一個快速的臨時存儲空間。

一個表格:

存儲方式 描述 選擇場景
BTree

關鍵字有序存儲,並且其結構能隨數據的插入和刪除進行動態調整。

爲了代碼的簡單, Berkeley DB 沒有實現對關鍵字的前綴碼壓縮。

B+ 樹支持對數據查詢、插入、刪除的常數級速度。關鍵字可以爲任意的數據結構

1   Key 爲複雜類型時。

2   Key 有序時。

Hash

DB 中實際使用的是擴展線性 HASH 算法( extended linear hashing ),

可以根據 HASH 表的增長進行適當的調整。關鍵字可以爲任意的數據結構。

1   Key 爲複雜類型。

2   當數據較大且 key 隨機分佈時。

Recno

要求每一個記錄都有一個邏輯紀錄號,邏輯紀錄號由算法本身生成。

相當於關係數據庫中的自動增長字段。

Recho 建立在 B+ 樹算法之上,提供了一個存儲有序數據的接口。

記錄的長度可以爲定長或不定長。

1   key 爲邏輯記錄號時。

2   當非高併發的情況下。

 

Queue

Recno 方式接近 ,  只不過記錄的長度爲定長。

數據以定長記錄方式存儲在隊列中,插入操作把記錄插入到隊列的尾部,

相比之下插入速度是最快的。

1     key 爲邏輯記錄號時。

2   定長記錄。

3   高併發的情況下。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章