【GaussDB】初始GaussDB和GaussDB版本介紹

初始GaussDB

名字的由來:GaussDB是華爲數據庫產品品牌名,致敬數據加高斯(Gauss)

GaussDB的版本
  • GaussDB 100:目前暫不發佈,公司合作伙伴需向華爲提交申請
  • GaussDB 200:目前官方可下載
  • GaussDB 300:無
GaussDB版本的區別
  • GaussDB T(OLTP):前身是GauussDB 100,主打OLTP在線事務處理。用於存儲/查詢業務應用中活動的數據以支撐日常的業務活動。對標Oracle及其他關係型數據庫。現已運用在招商銀行(掌上生活)。
  • GaussDB A(OLAP):前身是GaussDB 200,主打OLAP在線分析處理,用於存儲歷史數據以支撐複雜的分析操作,側重決策支持。對標Teradata及其他分佈式數據庫,目前在工商銀行得到上線應用。
    在這裏插入圖片描述
OLTP和OLAP比較
數據處理類型 OLTP OLAP
分析粒度 細節的 細節的,綜合的,或提煉的
時效性 在存取瞬間是準確的 代表過去的數據
可更新性 可更新 不更新
操作可預知性 操作需求事先可知道 操作需求事先可能不知道
實時性 對性能要求高,相應毫秒級別、秒級 對性能要求相對寬鬆,相應分鐘級、小時級
數據量 一個時刻操作一條或幾條記錄,數據量小 一個時刻操作一集合,數據量大
驅動方式 事務驅動 分析驅動
應用類型 面向應用 面向分析
應用場景 支持日常運營 支持管理需求
典型應用 銀行核心系統、信用卡系統 ACRM、風險管理
GaussDB T介紹

GaussDB T是一款全透明分佈式數據庫,支持x86和Kunpeng硬件架構,基於創新性數據庫內核,提供高併發事務實時處理能力、兩地三中心金融級高可用能力和分佈式高擴展能力,用於支撐金融、政府、電信等行業核心關鍵系統。

**特點:**高性能、安全可靠、易開發、易運維。

發展史:
GaussDB T 數據庫從2002年開始研發,基於全自研內核,自主可控。
在這裏插入圖片描述
部署形態:
GaussDB T 支持多種部署方式,支持單機、主備 和 分佈式部署,支持x86和鯤鵬的硬件
在這裏插入圖片描述

概念補充:

  • 實例:zengine進程及其所管理內存結構。實例用於控制和管理數據庫,是數據庫提供服務的媒介。Gauss100爲多線程架構,實例只包含一個進程——zengine。
  • 數據庫:控制文件、日誌文件、數據文件等物理文件的集合。
  • 實例和數據庫的關係:實例加載數據庫,並對外提供服務;數據庫通過實例與外界交互,達到存取數據的目的。一個實例,最多隻能加載一個數據庫。
GaussDB A 介紹

GaussDB 200是企業級的大規模並行處理關係型數據庫。其採用MPP(Massive Parallel Processing)架構,支持行存儲與列存儲,提供PB(Petabyte,2的50次方字節)級別數據量的處理能力。

應用場景:
訂單查詢、數據倉庫、混合負載、大數據分析

技術特點:
低成本、高性能、高可靠、支持海量數據

GaussDB 200部署形態:
GaussDB 200整個系統網絡劃分爲2個平面,即業務平面管理平面。兩個平面之間採用物理隔離的方式進行部署,保證業務、管理各自網絡的安全性。

  • 管理平面:通過運維網絡接入,提供系統管理和維護功能,主要用於集羣的管理,對外提供集羣監控、配置、審計、用戶管理等服務。
  • 業務平面:主要用於集羣內部數據處理的專用網絡平面,此處的業務平面非客戶的應用網絡平面。
    在這裏插入圖片描述
    組網方案節點如下:
節點類型 說明
管理節點 Management Node(MN),是GaussDB 200集羣的管理系統,提供統一的訪問入口。FusionInsight Manager對部署在集羣中的節點及服務進行集中管理。主要部署OMSServer。
控制節點 Control Node(CN),控制節點控制監控數據節點,並執行對集羣接入用戶的認證鑑權,存放認證鑑權數據。GaussDB 200的控制節點主要部署KrbServer、LdapServer等。
數據節點 Data Node(DN),執行管理節點發出的指示,上報任務狀態、存儲數據,以及執行數據節點的公共功能。GaussDB 200的數據節點主要部署MPPDBServer。
MPP架構介紹

MPP即大規模並行處理(Massively Parallel Processing )。 在數據庫非共享集羣中,每個節點都有獨立的磁盤存儲系統和內存系統,業務數據根據數據庫模型和應用特點劃分到各個節點上,每臺數據節點通過專用網絡或者商業通用網絡互相連接,彼此協同計算,作爲整體提供數據庫服務。非共享數據庫集羣有完全的可伸縮性、高可用、高性能、優秀的性價比、資源共享等優勢。
在這裏插入圖片描述

優勢:

  1. 計算靠近數據,避免了大量的數據搬遷,可以獲得更高的性能。
  2. 無共享架構相比共享存儲的架構,具備更好的擴展性。
架構組件介紹

在這裏插入圖片描述

  • CN(Coordinator Node):協調節點,負責接收來自應用的訪問請求,並向客戶端返回執行結果;負責分解任務,並調度任務分片在各DN上並行執行。(分佈式業務接入,數據訪問路由)

  • DN(Database Node):數據節點,數據庫核心組件,提供數據查詢和數據存儲能力。

  • CM(Cluster Manager):集羣管理,負責集羣內高可用。管理和監控分佈式系統中各個功能單元和物理資源運行情況,確保整個系統穩定運行。

  • OM(Operation Manager):運維管理,工具和命令集,提供日常運維、備份、配置、監控等管理結構和工具鏈

  • DM(Database Manger):圖形化運維入口(圖中未畫出),提供豐富的圖形化運維管理功能

  • DT(Developer Tools):開發工具,Data Studio(DS)SQL圖形化開發工具;
    數據遷移工具,提供離線、在線等多種數據遷移方案。

  • GTS(Global Time Service):全局鬧鐘服務。 用於強一致場景下,爲各個節點提供邏輯時鐘。

  • GTM:全局事務控制器,負責生成和維護全局事務ID、事物快照、時間戳等需要全局唯一的信息。

  • WLM:工作負責管理器,控制系統資源的分配,防止過量業務負載對系統的衝擊而導致業務擁塞和系統崩潰。
    在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章