分佈式數據庫概述

1.前言

隨着傳統的數據庫技術日趨成熟、計算機網絡技術的飛速發展和應用範圍的擴充,數據庫應用已經普遍建立於計算機網絡之上。這時集中式數據庫系統表現出它的不足:數據按實際需要已在網絡上分佈存儲,再採用集中式處理,勢必造成通信開銷大;應用程序集中在一臺計算機上運行,一旦該計算機發生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式DB的“集中計算”概念向“分佈計算”概念發展。分佈計算主要體現在客戶機/服務器模式和分佈式數據庫體系結構兩個方面。

2.分佈式數據庫系統概述

隨着傳統的數據庫技術日趨成熟、計算機網絡技術的飛速發展和應用範圍的擴大,以分佈式爲主要特徵的數據庫系統的研究與開發受到人們的注意。分佈式數據庫是數據庫技術與網絡技術相結合的產物,在數據庫領域已形成一個分支。分佈式數據庫的研究始於20世紀70年代中期。世界上第一個分佈式數據庫系統SDD-1是由美國計算機公司(CCA)於1979年在DEC計算機上實現。20世紀90年代以來,分佈式數據庫系統進入商品化應用階段,傳統的關係數據庫產品均發展成以計算機網絡及多任務操作系統爲核心的分佈式數據庫產品,同時分佈式數據庫逐步向客戶機/服務器模式發展。

3.DDBS的分類

(1) 同構同質型DDBS:各個場地都採用同一類型的數據模型(譬如都是關係型),並且是同一型號的DBMS。
(2)同構異質型DDBS:各個場地採用同一類型的數據模型,但是DBMS的型號不同,譬如DB2、ORACLE、SYBASE、SQL Server等。
(3)異構型DDBS:各個場地的數據模型的型號不同,甚至類型也不同。隨着計算機網絡技術的發展,異種機聯網問題已經得到較好的解決,此時依靠異構型DDBS就能存取全網中各種異構局部庫中的數據。

4.DDBS的特點和優缺點

DDBS的基本特點:
(1)物理分佈性:數據不是存儲在一個場地上,而是存儲在計算機網絡的多個場地上。
邏輯整體性:數據物理分佈在各個場地,但邏輯上是一個整體,它們被所有用戶(全局用戶)共享,並由一個DDBMS統一管理。
(2)場地自治性:各場地上的數據由本地的DBMS管理,具有自治處理能力,完成本場地的應用(局部應用)。
(3)場地之間協作性:各場地雖然具有高度的自治性,但是又相互協作構成一個整體。
DDBS的其他特點
(1)數據獨立性 
(2)集中與自治相結合的控制機制 
(3)適當增加數據冗餘度 
(4)事務管理的分佈性

DDBS的優點:

(1)具有靈活的體系結構 
(2)適應分佈式的管理和控制機構 
(3)經濟性能優越 
(4)系統的可靠性高、可用性好 
(5)局部應用的響應速度快 
(5)可擴展性好,易於集成現有的系統
DDBS的缺點 
(1)系統開銷較大,主要花在通信部分 。
(2)複雜的存取結構(如輔助索引、文件的鏈接技術),在集中式DBS中是有效存取數據的重要技術,但在分佈式系統中不一定有效。 
(3)數據的安全性和保密性較難處理。

5.數據分片

類型:
(1)水平分片:按一定的條件把全局關係的所有元組劃分成若干不相交的子集,每個子集爲關係的一個片段。
(2)垂直分片:把一個全局關係的屬性集分成若干子集,並在這些子集上作投影運算,每個投影稱爲垂直分片。
(3)導出分片:又稱爲導出水平分片,即水平分片的條件不是本關係屬性的條件,而是其他關係屬性的條件。
(4)混合分片:以上三種方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他們的結果是不相同的。

條件:
(1)完備性條件:必須把全局關係的所有數據映射到片段中,決不允許有屬於全局關係的數據卻不屬於它的任何一個片段。
(2)可重構條件:必須保證能夠由同一個全局關係的各個片段來重建該全局關係。對於水平分片可用並操作重構全局關係;對於垂直分片可用聯接操作重構全局關係。
(3)不相交條件:要求一個全局關係被分割後所得的各個數據片段互不重疊(對垂直分片的主鍵除外)。

6.數據分配方式

(1)集中式:所有數據片段都安排在同一個場地上。 
(2)分割式:所有數據只有一份,它被分割成若干邏輯片段,每個邏輯片段被指派在一個特定的場地上。 
(4)全複製式:數據在每個場地重複存儲。也就是每個場地上都有一個完整的數據副本。
(5)混合式:這是一種介乎於分割式和全複製式之間的分配方式。

7.體系結構

分佈式數據庫概述

數據分片和數據分配概念的分離,形成了“數據分佈獨立型”概念。
數據冗餘的顯式控制。數據在各個場地的分配情況在分配模式中一目瞭然,便於系統管理。
局部DBMS的獨立性。這個特徵也稱爲“局部映射透明性”。此特徵允許我們在不考慮局部DBMS專用數據模型的情況下,研究DDB管理的有關問題。

8.分佈式數據庫管理系統

分佈式數據庫概述

接受用戶請求,並判定把它送到哪裏,或必須訪問哪些計算機才能滿足該要求。
訪問網絡數據字典,瞭解如何請求和使用其中的信息。
如果目標數據存儲於系統的多個計算機上,就必須進行分佈式處理。
通信接口功能。在用戶、局部DBMS和其他計算機的DBMS之間進行協調。
在一個異構型分佈式處理環境中,還需提供數據和進程移植的支持。這裏的異構型是指各個場地的硬件、軟件之間存在着差別。

分佈式數據庫概述

9.小 結

(1)“分佈計算”概念突破了集中式DBS的框架,數據分佈使系統走上分佈式DB的道路,功能分佈使系統走上C/S道路。這是DBS的兩個發展。
(2)C/S系統包括一個計算機網絡,通常用一個局域網連結。幾乎在所有情況下,客戶機都是微機;服務器有時用小型機或大型機,但多數情況下也使用微機或高檔微機。應用程序在客戶機上處理,DBMS和OS的數據管理分放在服務器上。 
(3)C/S結構經歷了從兩層、三層到多層的演變過程。總的趨勢是使客戶機越來越“瘦”,變成瀏覽器;而服務器的種類越來越多,容易實現系統的組裝。
(4)C/S系統使應用與用戶更加貼近,爲用戶提供較好的性能和更復雜的界面。
(5)分佈式系統是在集中式系統的基礎上發展而來的。DDB是數據庫技術與網絡技術結合的產物。隨着計算機網絡技術的飛速發展,DDBS日趨成爲數據庫領域的主流方向。 
(6)DDB具有數據分佈性和邏輯整體性的特點。DDBS能夠支持涉及多個場地的全局應用。DDB的數據存儲有數據分片和數據分配兩種策略。
(7)DDB的模式結構爲理解DDBS提供了一種通用的概念結構。分佈透明性是DDBS追求的目標。DDBMS是負責管理分佈環境下,邏輯集成數據的存取、一致性、有效性和完備性的軟件系統。
(8)DDBS中數據分佈在各個場地,系統中壓倒一切的性能目標是儘量減少網絡中傳送信息的次數和傳送的數據量。分佈式查詢中基於半聯接的優化策略是常用的技術。
(9)對於併發控制和恢復,DDBMS環境中會出現大量在集中式DBMS環境中碰不到的問題。分佈式的併發控制有主場地方法和主拷貝方法,再輔之於備份場地技術。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章