數據庫基礎

數據庫基礎

數據庫(Database)是按照數據結構來組織、存儲和管理數據的倉庫,它產生於距今六十多年前,隨着信息技術和市場的發展,特別是二十世紀九十年代以後,數據管理不再僅僅是存儲和管理數據,而轉變成用戶所需要的各種數據管理的方式。數據庫有很多種類型,從最簡單的存儲有各種數據的表格到能夠進行海量數據存儲的大型數據庫系統都在各個方面得到了廣泛的應用。

在信息化社會,充分有效地管理和利用各類信息資源,是進行科學研究和決策管理的前提條件。數據庫技術是管理信息系統、辦公自動化系統、決策支持系統等各類信息系統的核心部分,是進行科學研究和決策管理的重要技術手段。

 

基本定義

基本定義1

數據庫,簡單來說是本身可視爲電子化的文件櫃--存儲電子文件的處所,用戶可以對文件中的數據進行新增、截取、更新、刪除等操作。

數據庫指的是以一定方式儲存在一起、能爲多個用戶共享、具有儘可能小的冗餘度的特點、是與應用程序彼此獨立的數據集合。

在經濟管理的日常工作中,常常需要把某些相關的數據放進這樣的"倉庫",並根據管理的需要進行相應的處理。

例如,企業或事業單位的人事部門常常要把本單位職工的基本情況(職工號、姓名、年齡、性別、籍貫、工資、簡歷等)存放在表中,這張表就可以看成是一個數據庫。有了這個"數據倉庫"我們就可以根據需要隨時查詢某職工的基本情況,也可以查詢工資在某個範圍內的職工人數等等。這些工作如果都能在計算機上自動進行,那我們的人事管理就可以達到極高的水平。此外,在財務管理、倉庫管理、生產管理中也需要建立衆多的這種"數據庫",使其可以利用計算機實現財務、倉庫、生產的自動化管理。

 

基本定義2

數據庫是依照某種數據模型組織起來並存放二級存儲器中的數據集合。這種數據集合具有如下特點:儘可能不重複,以最優方式爲某個特定組織的多種應用服務,其數據結構獨立於使用它的應用程序,對數據的增、刪、改、查由統一軟件進行管理和控制。從發展的歷史看,數據庫是數據管理的高級階段,它是由文件管理系統發展起來的。

 

處理系統

數據庫是一個單位或是一個應用領域的通用數據處理系統,它存儲的是屬於企業和事業部門、團體和個人的有關數據的集合。數據庫中的數據是從全局觀點出發建立的,按一定的數據模型進行組織、描述和存儲。其結構基於數據間的自然聯繫,從而可提供一切必要的存取路徑,且數據不再針對某一應用,而是面向全組織,具有整體的結構化特徵。

數據庫中的數據是爲衆多用戶所共享其信息而建立的,已經擺脫了具體程序的限制和制約。不同的用戶可以按各自的用法使用數據庫中的數據;多個用戶可以同時共享數據庫中的數據資源,即不同的用戶可以同時存取數據庫中的同一個數據。數據共享性不僅滿足了各用戶對信息內容的要求,同時也滿足了各用戶之間信息通信的要求。

 

基本結構

數據庫的基本結構分三個層次,反映了觀察數據庫的三種不同角度。

  1. 內模式爲框架所組成的數據庫叫做物理數據庫
  2. 概念模式爲框架所組成的數據叫做概念數據庫
  3. 外模式爲框架所組成的數據庫叫做用戶數據庫
  1. 物理數據層:它是數據庫的最內層,是物理存貯設備上實際存儲的數據的集合。這些數據是原始數據,是用戶加工的對象,由內部模式描述的指令操作處理的位串、字符和字組成。
  2. 概念數據層:它是數據庫的中間一層,是數據庫的整體邏輯表示。指出了每個數據的邏輯定義及數據間的邏輯聯繫,是存貯記錄的集合。它所涉及的是數據庫所有對象的邏輯關係,而不是它們的物理情況,是數據庫管理員概念下的數據庫。
  3. 用戶數據層:它是用戶所看到和使用的數據庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。數據庫不同層次之間的聯繫是通過映射進行轉換的。

 

主要特點

  1. 實現數據共享:數據共享包含所有用戶可同時存取數據庫中的數據,也包括用戶可以用各種方式通過接口使用數據庫,並提供數據共享。
  2. 減少數據的冗餘度:同文件系統相比,由於數據庫實現了數據共享,從而避免了用戶各自建立應用文件。減少了大量重複數據,減少了數據冗餘,維護了數據的一致性。
  3. 數據的獨立性:數據的獨立性包括邏輯獨立性(數據庫中數據庫的邏輯結構和應用程序相互獨立)和物理獨立性(數據物理結構的變化不影響數據的邏輯結構)
  4. 數據實現集中控制:文件管理方式中,數據處於一種分散的狀態,不同的用戶或同一用戶在不同處理中其文件之間毫無關係。利用數據庫可對數據進行集中控制和管理,並通過數據模型表示各種數據的組織以及數據間的聯繫。
  5. 數據一致性和可維護性,以確保數據的安全性和可靠性:主要包括①安全性控制:以防止數據丟失、錯誤更新和越權使用;②完整性控制:保證數據的正確性、有效性和相容性;③併發控制:使在同一時間週期內,允許對數據實現多路存取,又能防止用戶之間的不正常交互作用。
  6. 故障恢復:由數據庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞。數據庫系統能儘快恢復數據庫系統運行時出現的故障,可能是物理上或是邏輯上的錯誤。比如對系統的誤操作造成的數據錯誤等。

 

數據種類

數據庫通常分爲層次式數據庫網絡式數據庫關係式數據庫三種。而不同的數據庫是按不同的數據結構來聯繫和組織的。

 

數據結構模型

數據結構

所謂數據結構是指數據的組織形式或數據之間的聯繫。

如果用D表示數據,用R表示數據對象之間存在的關係集合,則將DS=(DR)稱爲數據結構。

例如,設有一個電話號碼簿,它記錄了n個人的名字和相應的電話號碼。爲了方便地查找某人的電話號碼,將人名和號碼按字典順序排列,並在名字的後面跟隨着對應的電話號碼。這樣,若要查找某人的電話號碼(假定他的名字的第一個字母是Y),那麼只須查找以Y開頭的那些名字就可以了。該例中,數據的集合D就是人名和電話號碼,它們之間的聯繫R就是按字典順序的排列,其相應的數據結構就是DS=(DR),即一個數組。

 

數據結構類型

數據結構又分爲數據的邏輯結構和數據的物理結構

  1. 數據的邏輯結構是從邏輯角度(即數據間的聯繫和組織方式)觀察數據,分析數據,與數據的存儲位置無關;
  2. 數據的物理結構是指數據在計算機中存放的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也被稱爲存儲結構。

這裏只研究數據的邏輯結構,並將反映和實現數據聯繫的方法稱爲數據模型。

比較流行的數據模型有三種,即按圖論理論建立的層次結構模型網狀結構模型以及按關係理論建立的關係結構模型

 

層次、網狀和關係數據庫系統

層次結構模型

層次結構模型實質上是一種有根結點的定向有序樹(在數學中""被定義爲一個無回的連通圖)。下圖是一個高等學校的組織結構圖。這個組織結構圖像一棵樹,校部就是樹根(稱爲根結點),各系、專業、教師、學生等爲枝點(稱爲結點),樹根與枝點之間的聯繫稱爲邊,樹根與邊之比爲1:N,即樹根只有一個,樹枝有N個。

按照層次模型建立的數據庫系統稱爲層次模型數據庫系統IMS(Information Management System)是其典型代表。

 

網狀結構模型

按照網狀數據結構建立的數據庫系統稱爲網狀數據庫系統,其典型代表是DBTG(Database Task Group)。用數學方法可將網狀數據結構轉化爲層次數據結構。

 

關係結構模型

關係式數據結構把一些複雜的數據結構歸結爲簡單的二元關係(即二維表格形式)。例如某單位的職工關係就是一個二元關係。

由關係數據結構組成的數據庫系統被稱爲關係數據庫系統

在關係數據庫中,對數據的操作幾乎全部建立在一個或多個關係表格上,通過對這些關係表格的分類、合併、連接或選取等運算來實現數據的管理。

dBASEⅡ就是這類數據庫管理系統的典型代表。對於一個實際的應用問題(如人事管理問題),有時需要多個關係才能實現。用dBASEⅡ建立起來的一個關係稱爲一個數據庫(或稱數據庫文件),而把對應多個關係建立起來的多個數據庫稱爲數據庫系統。dBASEⅡ的另一個重要功能是通過建立命令文件來實現對數據庫的使用和管理,對於一個數據庫系統相應的命令序列文件,稱爲該數據庫的應用系統。

因此,可以概括地說,一個關係稱爲一個數據庫,若干個數據庫可以構成一個數據庫系統。數據庫系統可以派生出各種不同類型的輔助文件和建立它的應用系統。

http://images.51cto.com/files/uploadimg/20091102/161621510.jpg

優點:

  1. 簡單:關係數據模型比層次和網狀模型更簡單,設計人員不再受到實際物理數據存儲細節的約束,因而可以專注於數據庫的邏輯視圖。
  2. 結構獨立性:與層次和網狀模型不同的是,關係數據模型不依賴於導航式的數據訪問系統。數據庫結構的變化不會影響數據訪問。
  3. 易於設計、實現、維護和使用:關係模型提供結構獨立性和數據獨立性,這使得數據庫的設計、實現、維護和使用更容易。
  4. 靈活和強大的查詢能力:關係數據庫模型提供非常強大、靈活和易於使用的查詢能力。其結構化查詢語言(SQL)使得特別的查詢成爲現實。

缺點:

  1. 硬件開銷:關係數據模型需要更高效的計算硬件和數據存儲設備來完成RDBMS安排的任務。因此,它們可能比其他數據庫更慢。但是,隨着計算機技術和更高效的操作系統的快速發展,速度慢的缺點已不再成爲問題。
  2. 易於設計導致不好的設計:關係數據庫易於使用的特點導致未經訓練的人員在沒有充分理解和深入思考的情況下生成查詢和報表來滿足真正的數據庫設計需要。不好的設計導致系統更慢、性能下降和數據不可靠。

 

發展簡史

技術發展

使用計算機後,隨着數據處理量的增長,產生了數據管理技術。數據管理技術的發展與計算機硬件(主要是外部存儲器)系統軟件及計算機應用的範圍有着密切的聯繫。數據管理技術的發展經歷了以下四個階段:人工管理階段文件系統階段數據庫階段高級數據庫技術階段

數據庫的歷史可以追溯到五十年前,那時的數據管理非常簡單。通過大量的分類、比較和表格繪製的機器運行數百萬穿孔卡片來進行數據的處理,其運行結果在紙上打印出來或者製成新的穿孔卡片。而數據管理就是對所有這些穿孔卡片進行物理的儲存和處理。然而,1950 年雷明頓蘭德公司(Remington Rand Inc)的一種叫做Univac I 的計算機推出了一種一秒鐘可以輸入數百條記錄的磁帶驅動器,從而引發了數據管理的革命。1956 IBM生產出第一個磁盤驅動器-- the Model 305 RAMAC。此驅動器有50 個盤片,每個盤片直徑是2 英尺,可以儲存5MB的數據。使用磁盤最大的好處是可以隨機存取數據,而穿孔卡片和磁帶只能順序存取數據。

數據庫系統的萌芽出現於二十世紀60 年代。當時計算機開始廣泛地應用於數據管理,對數據的共享提出了越來越高的要求。傳統的文件系統已經不能滿足人們的需要,能夠統一管理和共享數據的數據庫管理系統(DBMS)應運而生。數據模型是數據庫系統的核心和基礎,各種DBMS軟件都是基於某種數據模型的。所以通常也按照數據模型的特點將傳統數據庫系統分成網狀數據庫、層次數據庫和關係數據庫三類。

最早出現的網狀DBMS,是美國通用電氣公司Bachman等人在1961年開發的IDS(Integrated Data Store)1964年通用電氣公司(General ElectricCo.)Charles Bachman 成功地開發出世界上第一個網狀DBMS也即第一個數據庫管理系統--集成數據存儲(Integrated Data Store IDS),奠定了網狀數據庫的基礎,並在當時得到了廣泛的發行和應用。IDS 具有數據模式和日誌的特徵,但它只能在GE主機上運行,並且數據庫只有一個文件,數據庫所有的表必須通過手工編碼生成。之後,通用電氣公司一個客戶--BF Goodrich Chemical 公司最終不得不重寫了整個系統,並將重寫後的系統命名爲集成數據管理系統(IDMS)

網狀數據庫模型對於層次和非層次結構的事物都能比較自然的模擬,在關係數據庫出現之前網狀DBMS要比層次DBMS用得普遍。在數據庫發展史上,網狀數據庫佔有重要地位。

層次型DBMS是緊隨網絡型數據庫而出現的,最著名最典型的層次數據庫系統是IBM 公司在1968 年開發的IMS(Information Management System),一種適合其主機的層次數據庫。這是IBM公司研製的最早的大型數據庫系統程序產品。從60年代末產生起,如今已經發展到IMSV6,提供羣集、N路數據共享、消息隊列共享等先進特性的支持。這個具有30年曆史的數據庫產品在如今的WWW應用連接、商務智能應用中扮演着新的角色。

1973Cullinane公司(也就是後來的Cullinet軟件公司),開始出售Goodrich公司的IDMS改進版本,並且逐漸成爲當時世界上最大的軟件公司。

關係由來

網狀數據庫和層次數據庫已經很好地解決了數據的集中和共享問題,但是在數據獨立性和抽象級別上仍有很大欠缺。用戶在對這兩種數據庫進行存取時,仍然需要明確數據的存儲結構,指出存取路徑。而後來出現的關係數據庫較好地解決了這些問題。

1970年,IBM的研究員E.F.Codd博士在刊物《Communication of the ACM》上發表了一篇名爲"A Relational Model of Data for Large Shared Data Banks"的論文,提出了關係模型的概念,奠定了關係模型的理論基礎。儘管之前在1968Childs已經提出了面向集合的模型,然而這篇論文被普遍認爲是數據庫系統歷史上具有劃時代意義的里程碑。Codd的心願是爲數據庫建立一個優美的數據模型。後來Codd又陸續發表多篇文章,論述了範式理論和衡量關係系統的12條標準,用數學理論奠定了關係數據庫的基礎。關係模型有嚴格的數學基礎,抽象級別比較高,而且簡單清晰,便於理解和使用。但是當時也有人認爲關係模型是理想化的數據模型,用來實現DBMS是不現實的,尤其擔心關係數據庫的性能難以接受,更有人視其爲當時正在進行中的網狀數據庫規範化工作的嚴重威脅。爲了促進對問題的理解,1974ACM牽頭組織了一次研討會,會上開展了一場分別以CoddBachman爲首的支持和反對關係數據庫兩派之間的辯論。這次著名的辯論推動了關係數據庫的發展,使其最終成爲現代數據庫產品的主流。

1969Edgar F."Ted" Codd發明了關係數據庫。

1970年關係模型建立之後,IBM公司在San Jose實驗室增加了更多的研究人員研究這個項目,這個項目就是著名的System R。其目標是論證一個全功能關係DBMS的可行性。該項目結束於1979年,完成了第一個實現SQL DBMS。然而IBMIMS的承諾阻止了System R的投產,一直到1980System R才作爲一個產品正式推向市場。IBM產品化步伐緩慢的三個原因:IBM重視信譽,重視質量,儘量減少故障;IBM是個大公司,官僚體系龐大,IBM內部已經有層次數據庫產品,相關人員不積極,甚至反對。

然而同時,1973年加州大學伯克利分校的Michael StonebrakerEugene Wong利用System R已發佈的信息開始開發自己的關係數據庫系統Ingres。他們開發的Ingres項目最後由Oracle公司、Ingres公司以及硅谷的其他廠商所商品化。後來,System RIngres系統雙雙獲得ACM1988"軟件系統獎"

1976年霍尼韋爾公司(Honeywell)開發了第一個商用關係數據庫系統--Multics Relational Data Store。關係型數據庫系統以關係代數爲堅實的理論基礎,經過幾十年的發展和實際應用,技術越來越成熟和完善。其代表產品有OracleIBM公司的 DB2、微軟公司的MS SQL Server以及InformixADABAS D等等。

 

結構語言

1974IBMRay BoyceDon ChamberlinCodd關係數據庫的12條準則的數學定義以簡單的關鍵字語法表現出來,里程碑式地提出了SQL(Structured Query Language)語言。SQL語言的功能包括查詢、操縱、定義和控制,是一個綜合的、通用的關係數據庫語言,同時又是一種高度非過程化的語言,只要求用戶指出做什麼而不需要指出怎麼做。SQL集成實現了數據庫生命週期中的全部操作。SQL提供了與關係數據庫進行交互的方法,它可以與標準的編程語言一起工作。自產生之日起,SQL語言便成了檢驗關係數據庫的試金石,而SQL語言標準的每一次變更都指導着關係數據庫產品的發展方向。然而,直到二十世紀七十年代中期,關係理論才通過SQL在商業數據庫OracleDB2中使用。

1986年,ANSISQL作爲關係數據庫語言的美國標準,同年公佈了標準SQL文本。SQL標準有3個版本。基本SQL定義是ANS3135-89"Database Language - SQL with Integrity Enhancement"[ANS89],一般叫做SQL-89SQL-89定義了模式定義、數據操作和事務處理。SQL- 89和隨後的ANS3168-1989"Database Language-Embedded SQL"構成了第一代SQL標準。ANS3135-1992[ANS92]描述了一種增強功能的SQL,叫做SQL-92標準。SQL-92包括模式操作,動態創建和SQL語句動態執行、網絡環境支持等增強特性。在完成SQL-92標準後,ANSIISO即開始合作開發SQL3標準。SQL3的主要特點在於抽象數據類型的支持,爲新一代對象關係數據庫提供了標準。

1976IBM E.F.Codd發表了一篇里程碑的論文"R系統:數據庫關係理論",介紹了關係數據庫理論和查詢語言SQLOracle的創始人Ellison非常仔細地閱讀了這篇文章,被其內容震驚,這是第一次有人用全面一致的方案管理數據信息。作者E.F.Codd 1966年就發表了關係數據庫理論,並在IBM研究機構開發原型,這個項目就是R系統,存取數據表的語言就是SQLEllison看完後,敏銳意識到在這個研究基礎上可以開發商用軟件系統。而當時大多數人認爲關係數據庫不會有商業價值。Ellison認爲這是他們的機會:他們決定開發通用商用數據庫系統Oracle,這個名字來源於他們曾給中央情報局做過的項目名。幾個月後,他們就開發了Oracle 1.0。但這只不過是個玩具,除了完成簡單關係查詢不能做任何事情,他們花相當長的時間才使Oracle變得可用,維持公司運轉主要靠承接一些數據庫管理項目和做顧問諮詢工作。而IBM卻沒有計劃開發,爲什麼藍色巨人放棄了這個價值上百億的產品,原因有很多:IBM的研究人員大多是學術出身,他們最感興趣的是理論,而非推向市場的產品,從學術上看,研究成果應公開發表論文和演講能使他們成名,爲什麼不呢?還有一個很主要的原因就是IBM當時有一個銷售得還不錯的層次數據庫產品IMS。直到1985IBM才發佈了關係數據庫DB2Ellision那時已經成了千萬富翁。Ellison曾將IBM 選擇Microsoft MS-DOS作爲IBM-PC機的操作系統比爲:"世界企業經營歷史上最嚴重的錯誤,價值超過了上千億美元。"IBM發表R系統論文,而且沒有很快推出關係數據庫產品的錯誤可能僅僅次之。Oracle的市值在1996年就達到了280億美元。

 

對象數據

隨着信息技術和市場的發展,人們發現關係型數據庫系統雖然技術很成熟,但其侷限性也是顯而易見的:它能很好地處理所謂的"表格型數據",卻對技術界出現的越來越多的複雜類型的數據無能爲力。九十年代以後,技術界一直在研究和尋求新型數據庫系統。但在什麼是新型數據庫系統的發展方向的問題上,產業界一度是相當困惑的。受當時技術風潮的影響,在相當一段時間內,人們把大量的精力花在研究"面向對象的數據庫系統(object oriented database)"或簡稱"OO數據庫系統"。值得一提的是,美國Stonebraker教授提出的面向對象的關係型數據庫理論曾一度受到產業界的青睞。而Stonebraker本人也在當時被Informix花大價錢聘爲技術總負責人。

然而,數年發展表明,面向對象的關係型數據庫系統產品的市場發展的情況並不理想。理論上的完美性並沒有帶來市場的熱烈反應。其不成功的主要原因在於,這種數據庫產品的主要設計思想是企圖用新型數據庫系統來取代現有的數據庫系統。這對許多已經運用數據庫系統多年並積累了大量工作數據的客戶,尤其是大客戶來說,是無法承受新舊數據間的轉換而帶來的巨大工作量及鉅額開支的。另外,面向對象的關係型數據庫系統使查詢語言變得極其複雜,從而使得無論是數據庫的開發商家還是應用客戶都視其複雜的應用技術爲畏途。

 

管理變革

二十世紀六十年代後期出現了一種新型數據庫軟件:決策支持系統(DSS),其目的是讓管理者在決策過程中更有效地利用數據信息。於是在1970年,第一個聯機分析處理工具——Express誕生了。其他決策支持系統緊隨其後,許多是由公司的IT部門開發出來的。

1985年,第一個商務智能系統(business intelligence)Metaphor計算機系統有限公司爲Procter & Gamble公司開發出來,主要是用來連接銷售信息和零售的掃描儀數據。同年, Pilot軟件公司開始出售第一個商用客戶/服務器執行信息系統--Command Center。同樣在這年,加州大學伯克利分校Ingres項目演變成Postgres,其目標是開發出一個面向對象的數據庫。此後一年, Graphael公司開發了第一個商用的對象數據庫系統-Gbase

1988年,IBM公司的研究者Barry DevlinPaul Murphy發明了一個新的術語-信息倉庫,之後,IT的廠商開始構建實驗性的數據倉庫。1991年,W.H. "Bill" Inmon出版了一本"如何構建數據倉庫"的書,使得數據倉庫真正開始應用。

1991W.H."Bill" Inmon發表了"構建數據倉庫"

二十世紀九十年代,隨着基於PC的客戶/服務器計算模式和企業軟件包的廣泛採用,數據管理的變革基本完成。數據管理不再僅僅是存儲和管理數據,而轉變成用戶所需要的各種數據管理的方式。Internet的異軍突起以及XML語言的出現,給數據庫系統的發展開闢了一片新的天地。

 

發展階段

數據庫發展階段大致劃分爲如下的幾個階段:人工管理階段、文件系統階段、數據庫系統階段、高級數據庫階段。

 

人工管理

50年代中期之前,計算機的軟硬件均不完善。硬件存儲設備只有磁帶、卡片和紙帶,軟件方面還沒有操作系統,當時的計算機主要用於科學計算。這個階段由於還沒有軟件系統對數據進行管理,程序員在程序中不僅要規定數據的邏輯結構,還要設計其物理結構,包括存儲結構、存取方法、輸入輸出方式等。當數據的物理組織或存儲設備改變時,用戶程序就必須重新編制。由於數據的組織面向應用,不同的計算程序之間不能共享數據,使得不同的應用之間存在大量的重複數據,很難維護應用程序之間數據的一致性。

這一階段的主要特徵可歸納爲如下幾點:

  1. 計算機中沒有支持數據管理的軟件。
  2. 數據組織面向應用,數據不能共享,數據重複。
  3. 在程序中要規定數據的邏輯結構和物理結構,數據與程序不獨立。
  4. 數據處理方式--批處理。

 

文件系統

這一階段的主要標誌是計算機中有了專門管理數據庫的軟件——操作系統(文件管理)

上世紀50年代中期到60年代中期,由於計算機大容量存儲設備(如硬盤)的出現,推動了軟件技術的發展,而操作系統的出現標誌着數據管理步入一個新的階段。在文件系統階段,數據以文件爲單位存儲在外存,且由操作系統統一管理。操作系統爲用戶使用文件提供了友好界面。文件的邏輯結構與物理結構脫鉤,程序和數據分離,使數據與程序有了一定的獨立性。用戶的程序與數據可分別存放在外存儲器上,各個應用程序可以共享一組數據,實現了以文件爲單位的數據共享。

但由於數據的組織仍然是面向程序,所以存在大量的數據冗餘。而且數據的邏輯結構不能方便地修改和擴充,數據邏輯結構的每一點微小改變都會影響到應用程序。由於文件之間互相獨立,因而它們不能反映現實世界中事物之間的聯繫,操作系統不負責維護文件之間的聯繫信息。如果文件之間有內容上的聯繫,那也只能由應用程序去處理。

 

系統階段

60年代後,隨着計算機在數據管理領域的普遍應用,人們對數據管理技術提出了更高的要求:希望面向企業或部門,以數據爲中心組織數據,減少數據的冗餘,提供更高的數據共享能力,同時要求程序和數據具有較高的獨立性,當數據的邏輯結構改變時,不涉及數據的物理結構,也不影響應用程序,以降低應用程序研製與維護的費用。數據庫技術正是在這樣一個應用需求的基礎上發展起來的。

數據庫技術有如下特點:

  1. 面向企業或部門,以數據爲中心組織數據,形成綜合性的數據庫,爲各應用共享。
  2. 採用一定的數據模型。數據模型不僅要描述數據本身的特點,而且要描述數據之間的聯繫。
  3. 數據冗餘小,易修改、易擴充。不同的應用程序根據處理要求,從數據庫中獲取需要的數據,這樣就減少了數據的重複存儲,也便於增加新的數據結構,便於維護數據的一致性。
  4. 程序和數據有較高的獨立性。
  5. 具有良好的用戶接口,用戶可方便地開發和使用數據庫。
  6. 對數據進行統一管理和控制,提供了數據的安全性、完整性、以及併發控制。

從文件系統發展到數據庫系統,這在信息領域中具有里程碑的意義。在文件系統階段,人們在信息處理中關注的中心問題是系統功能的設計,因此程序設計占主導地位;而在數據庫方式下,數據開始佔據了中心位置,數據的結構設計成爲信息系統首先關心的問題,而應用程序則以既定的數據結構爲基礎進行設計。大事記

 

高級數據庫階段

數據庫技術從20世紀60年代中期產生至今已經有40多年的歷史,數據庫技術一直是最活躍、發展速度最快的IT技術之一。

隨着網絡和多媒體技術的迅猛發展,數據庫的應用也得到了更廣泛的拓展,數據庫進入了一個新的時期,現代數據庫技術融合多種技術,數據庫新技術正在不斷髮展。

隨着信息管理內容的不斷擴展,出現了豐富多樣的數據模型(層次模型,網狀模型,關係模型,面向對象模型,半結構化模型等),新技術也層出不窮(數據流,Web數據管理,數據挖掘等)。每隔幾年,國際上一些資深的數據庫專家就會聚集一堂,探討數據庫研究現狀,存在的問題和未來需要關注的新技術焦點。過去已有的幾個類似報告包括:1989Future Directions inDBMS Research-The Laguna BeachParticipants ;1990DatabaseSystems : Achievements and Opportunities ;1991W.H. Inmon 發表的《構建數據倉庫》;1995Database

發佈了858 篇原創文章 · 獲贊 667 · 訪問量 161萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章