初始GaussDB
名字的由來:GaussDB是華爲數據庫產品品牌名,致敬數據加高斯(Gauss)
GaussDB的版本
- GaussDB 100:目前暫不發佈,公司合作伙伴需向華爲提交申請
- GaussDB 200:目前官方可下載
- GaussDB 300:無
GaussDB版本的區別
- GaussDB T(OLTP):前身是GauussDB 100,主打OLTP在線事務處理。用於存儲/查詢業務應用中活動的數據以支撐日常的業務活動。對標Oracle及其他關係型數據庫。現已運用在招商銀行(掌上生活)。
- GaussDB A(OLAP):前身是GaussDB 200,主打OLAP在線分析處理,用於存儲歷史數據以支撐複雜的分析操作,側重決策支持。對標Teradata及其他分佈式數據庫,目前在工商銀行得到上線應用。
OLTP和OLAP比較
數據處理類型 | OLTP | OLAP |
---|---|---|
分析粒度 | 細節的 | 細節的,綜合的,或提煉的 |
時效性 | 在存取瞬間是準確的 | 代表過去的數據 |
可更新性 | 可更新 | 不更新 |
操作可預知性 | 操作需求事先可知道 | 操作需求事先可能不知道 |
實時性 | 對性能要求高,相應毫秒級別、秒級 | 對性能要求相對寬鬆,相應分鐘級、小時級 |
數據量 | 一個時刻操作一條或幾條記錄,數據量小 | 一個時刻操作一集合,數據量大 |
驅動方式 | 事務驅動 | 分析驅動 |
應用類型 | 面向應用 | 面向分析 |
應用場景 | 支持日常運營 | 支持管理需求 |
典型應用 | 銀行核心系統、信用卡系統 | ACRM、風險管理 |
GaussDB T介紹
GaussDB T是一款全透明分佈式數據庫,支持x86和Kunpeng硬件架構,基於創新性數據庫內核,提供高併發事務實時處理能力、兩地三中心金融級高可用能力和分佈式高擴展能力,用於支撐金融、政府、電信等行業核心關鍵系統。
**特點:**高性能、安全可靠、易開發、易運維。
發展史:
GaussDB T 數據庫從2002年開始研發,基於全自研內核,自主可控。
部署形態:
GaussDB T 支持多種部署方式,支持單機、主備 和 分佈式部署,支持x86和鯤鵬的硬件
概念補充:
- 實例:zengine進程及其所管理內存結構。實例用於控制和管理數據庫,是數據庫提供服務的媒介。Gauss100爲多線程架構,實例只包含一個進程——zengine。
- 數據庫:控制文件、日誌文件、數據文件等物理文件的集合。
- 實例和數據庫的關係:實例加載數據庫,並對外提供服務;數據庫通過實例與外界交互,達到存取數據的目的。一個實例,最多隻能加載一個數據庫。
GaussDB A 介紹
GaussDB 200是企業級的大規模並行處理關係型數據庫。其採用MPP(Massive Parallel Processing)架構,支持行存儲與列存儲,提供PB(Petabyte,2的50次方字節)級別數據量的處理能力。
應用場景:
訂單查詢、數據倉庫、混合負載、大數據分析
技術特點:
低成本、高性能、高可靠、支持海量數據
GaussDB 200部署形態:
GaussDB 200整個系統網絡劃分爲2個平面,即業務平面和管理平面。兩個平面之間採用物理隔離的方式進行部署,保證業務、管理各自網絡的安全性。
- 管理平面:通過運維網絡接入,提供系統管理和維護功能,主要用於集羣的管理,對外提供集羣監控、配置、審計、用戶管理等服務。
- 業務平面:主要用於集羣內部數據處理的專用網絡平面,此處的業務平面非客戶的應用網絡平面。
組網方案節點如下:
節點類型 | 說明 |
---|---|
管理節點 | Management Node(MN),是GaussDB 200集羣的管理系統,提供統一的訪問入口。FusionInsight Manager對部署在集羣中的節點及服務進行集中管理。主要部署OMSServer。 |
控制節點 | Control Node(CN),控制節點控制監控數據節點,並執行對集羣接入用戶的認證鑑權,存放認證鑑權數據。GaussDB 200的控制節點主要部署KrbServer、LdapServer等。 |
數據節點 | Data Node(DN),執行管理節點發出的指示,上報任務狀態、存儲數據,以及執行數據節點的公共功能。GaussDB 200的數據節點主要部署MPPDBServer。 |
MPP架構介紹
MPP即大規模並行處理(Massively Parallel Processing )。 在數據庫非共享集羣中,每個節點都有獨立的磁盤存儲系統和內存系統,業務數據根據數據庫模型和應用特點劃分到各個節點上,每臺數據節點通過專用網絡或者商業通用網絡互相連接,彼此協同計算,作爲整體提供數據庫服務。非共享數據庫集羣有完全的可伸縮性、高可用、高性能、優秀的性價比、資源共享等優勢。
優勢:
- 計算靠近數據,避免了大量的數據搬遷,可以獲得更高的性能。
- 無共享架構相比共享存儲的架構,具備更好的擴展性。
架構組件介紹
-
CN(Coordinator Node):協調節點,負責接收來自應用的訪問請求,並向客戶端返回執行結果;負責分解任務,並調度任務分片在各DN上並行執行。(分佈式業務接入,數據訪問路由)
-
DN(Database Node):數據節點,數據庫核心組件,提供數據查詢和數據存儲能力。
-
CM(Cluster Manager):集羣管理,負責集羣內高可用。管理和監控分佈式系統中各個功能單元和物理資源運行情況,確保整個系統穩定運行。
-
OM(Operation Manager):運維管理,工具和命令集,提供日常運維、備份、配置、監控等管理結構和工具鏈
-
DM(Database Manger):圖形化運維入口(圖中未畫出),提供豐富的圖形化運維管理功能
-
DT(Developer Tools):開發工具,Data Studio(DS)SQL圖形化開發工具;
數據遷移工具,提供離線、在線等多種數據遷移方案。 -
GTS(Global Time Service):全局鬧鐘服務。 用於強一致場景下,爲各個節點提供邏輯時鐘。
-
GTM:全局事務控制器,負責生成和維護全局事務ID、事物快照、時間戳等需要全局唯一的信息。
-
WLM:工作負責管理器,控制系統資源的分配,防止過量業務負載對系統的衝擊而導致業務擁塞和系統崩潰。