手把手帶你認識GaussDB輕量化運維管理工具

本文分享自華爲雲社區《GaussDB輕量化運維管理工具介紹》,作者: Gauss松鼠會小助手。

一、GaussDB 運維管理平臺簡介

cke_152.png

開放生態層

  • 友好Web界面,多雲皮膚個性化定製
  • 豐富的原子API
  • 公有云、合運營、HCSO、邊緣雲IES、HCS、輕量化、統一版本

基礎+智能運維能力

  • 豐富的基礎運維能力
  • 打造端到端全鏈路的智能自制運維平臺,覆蓋自監控、自診斷、自調優、自恢復和自安全全量功能,一鍵部署,精準實施;

標準化代理層

  • 全方位多層安全防護,精細隔離設計
  • 精準管理進程資源消耗控制,極少性能損耗
  • 標準化南向接口規範各引警插件化接入原子操作

通過授權,登錄到GaussDB運維管理平臺,我們可以看到如下界面:

1、實例總覽界面

cke_153.png

2、實例詳情頁面

cke_154.png

二、GaussDB 運維管理平臺功能介紹

1、平臺管理功能

作爲管控平臺,雲數據庫GaussDB管理平臺具備完善的安全防護策略。主要是通過用戶角色和用戶組劃分,細粒度的控制各個角色的訪問執行權限,守護運維的安全。

cke_155.png

基本功能:

1、管理用戶(user): 支持管理員對普通用戶進行增加、刪除、鎖定、重置密碼、用戶和實例(Instance)、用戶組的綁定等操作

2、管理用戶組(user_group): 可以將用戶加入用戶組中,針對整個用戶組可以設置統一的角色,用戶可以同時加到多個用戶組中

3、角色管理(Role): 可以自定義角色,增加對應的權限(permission),支持細粒度權限

4、管理活躍用戶會話: 可以查看當前登錄中的用戶,管理員可以結束會話

5、後臺功能: 提供鑑權、校驗弱密碼等接口,密碼會校驗規則和弱密碼,加密後存入元庫中。

2、實例管理功能

cke_156.png

1、實例納管

2、實例解除納管

3、實例啓停

4、實例擴容

5、實例升級管理

6、實例容災管理

7、實例告警管理

8、實例巡檢管理

三、GaussDB管理平臺實例管理基本功能

1、納管實例

  • 數據庫實例安裝完成後,狀態爲Normal>則可以使用GaussDB管理平臺將實例進行納管。
  • 納管前需將實例主機錄入主機管理中進行管理。
  • 輸入實例節點任意一個管理IP地址,點擊檢查實例節點,檢查主機是否已經錄入主機管理,主機狀態在線則已經錄入允許導入,主機狀態離線則未錄入,無法執行導入。
  • 所有主機都在線後。輸入實例名稱,管理員用戶名,管理員密碼點擊提交按鈕下發納管流程。

1.1 添加主機

cke_157.png

1.2 納管實例

cke_158.png

2、取消納管實例

cke_159.jpeg

  • GaussDB 運維管理平臺可以取消納管已經導入並納管的數據庫實例。
  • 首先在主頁上找到要取消納管的實例
  • 點擊“更多”->“取消納管”
  • 頁面彈出對話框進行管理員密碼的輸入

3、實例啓停

GaussDB 運維管理平臺支持對所納管的數據庫實例進行基本的啓停操作,主要包括停止實例啓動實例、重啓實例等。

cke_160.png

  • 在主頁找到需要管理的實例,點擊“更多”–>“停止實例”來停止實例運行
  • 對於已經停止運行的實例,點擊“更多”–>“啓動實例”來啓動實例運行
  • 也可以直接點擊“更多”–>“重啓實例”來快速對實例進行重啓

4、實例卸載

GaussDB 運維管理平臺支持對所納管的數據庫實例進行一鍵式卸載。

cke_161.png

注:刪除實例屬於高危操作,需要輸入“delete”進行二次確認。

  • GaussDB 運維管理平臺可以一鍵式刪除已經導入並納管的數據庫實例。
  • 首先在主頁上找到要刪除的實例,然後點擊“更多”->“刪除實例”。
  • 頁面彈出對話框進行二次確認。

5、節點擴容

隨着業務的增長,數據庫在運行性能及存儲上逐漸會達到瓶頸。此時,需要通過增加節點來提升實例的性能及存儲能力。GaussDB支持節點擴容操作。擴容方案如下:

cke_162.png

cke_163.png

在線擴容主要分爲加節點和數據重分佈兩個階段,除切換元數據外均支持在線業務。

  • 加節點階段:主要完成新的CN/DN節點的安裝、元信息同步、啓動等操作。
  • 數據重分佈階段:主要完成基線數據搬遷、增量數據搬遷(在線業務)、切換元數據等操作。

cke_164.png

注:同步元信息的目的在於爲後續數據重分佈做準備

向新增的DN、CN節點同步元數據:

1、同步基礎元信息:數據庫、模式、表空間

2、同步普通元信息:用戶表、函數

3、建立新的nodegroup(爲擴容後的新集羣)

4、元信息同步完成後切換installation group爲新建nodegroup

GaussDB 運維管理平臺支持對所納管的分佈式數據庫實例進行節點擴容。

cke_165.png

  • “實例管理”界面,單擊具體實例名稱,進入“基本信息”界面。
  • 在“數據庫信息”模塊的“節點數量”後,單擊“添加”進入“節點擴容”頁面。

cke_166.png

  • 選擇節點數量和管理地址,管理地址數量需要與新增節點數量一致,管理地址可用區分佈需要符合部署方案。
  • 確認“實例擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峯期進行該操作。” 風險提示信息,並勾選“我已確認閱讀上述風險提示”。
  • 單擊“下一步”進入“規格確認”界面。

cke_167.png

  • 確認無誤後,單擊“提交”,進行擴容。
  • 數據庫實例狀態將顯示爲“添加節點中”,則說明擴容指令下發成功。

注意事項

  • 擴容是指分片擴容,擴容的節點僅包含CN、DN,不含有其他組件。
  • 擴容以節點組爲單位,擴容節點的組件分佈形態與擴容前實例分佈規律相同。
  • 主備版部署模式暫時不支持擴容。
  • 存在故障節點的實例不允許擴容。
  • 實例擴容過程中會有鎖表操作,可能會阻塞業務,屬於高危操作。請選擇在業務低峯期進行該操作。
  • 擴容前,需要滿足所有DN節點剩餘可用空間大於DN節點的最大單表空間。

四、GaussDB管理平臺實例升級功能

1、GaussDB升級方式

升級過程涉及系統表和數據表變更,重啓進程,有版本兼容風險和業務中斷問題,根據升級方式,業務中斷時間,風險評估對比如下:

cke_168.png

大小版本升級方式比較

cke_169.png

2、就地升級

cke_170.png

  • 找到需要升級的實例點擊更多進行版本升級
  • 版本升級選擇就地升級方式
  • 選擇對應的目標版本

3、灰度升級

灰度升級分爲兩種方式:

1、升級自動提交方式: 所有節點一起升級,在升級過程中有大概10秒的業務中斷

2、升級待觀察後提交方式: 將數據庫升級過程細分爲升級待觀察和升級提交兩個階段

  • 升級待觀察階段

    升級待觀察階段可以按照AZ升級,也可以對升級的AZ進行回滾,所有AZ升級完成後可以對實例進行業務測試

  • 升級提交階段

    提交當前的升級,提交後不可回滾

3.1 灰度升級-升級自動提交

cke_171.png

  • 在實例管理主頁找到需要升級的實例點擊“版本升級”。
  • 在彈窗中選擇升級自動提交的操作方式和目標版本進行升級。

3.2 灰度升級-升級待觀察階段

cke_172.png

  • 灰度升級選擇升級待觀察
  • 選擇升級可用區中AZ進行升級
  • 選擇目標版本進行升級

3.3 灰度升級-升級待提交階段

cke_173.png

  • 升級完所有可用區的AZ之後,選擇提交升級,對實例進行真正的升級
  • 觀察階段發現升級的版本有問題,可以選擇升級回退

五、GaussDB 運維管理平臺實例容災管理

GaussDB 運維管理平臺流式容災管理的主要功能:

  • 容災搭建
  • 容災狀態查看
  • 容災倒換
  • 災備升主
  • 容災解除
  • 容災演練(規劃中)
  • 容災快速加回(規劃中)

流式容災:基於流複製的容災解決方案

cke_174.png

1、容災搭建

cke_175.png

  • 主數據庫實例配置災備數據庫實例信息,等待災備數據庫實例連接過來進行全量複製
  • 災備數據庫實例完成全量build之後,將與主數據庫實例建立流式複製進行日誌的增量複製

cke_176.png

2、容災狀態查看

cke_177.png

在容災管理界面,可以查看到已經創建好的容災關係組,並支持對容災實例進行容災倒換、災備升主、容災解除等操作。

cke_178.png

如上圖,在容災詳情頁面,可以查看容災基本信息,容災RTO、RPO數值,以及災備狀態指標;災備實例分片日誌差距、災備實例分片日誌落盤速率、災備實例分片待回放日誌量、災備實例分片日誌回放速率。

3、容災倒換

cke_179.png

  • 可以通過容災倒換,將容災關係中主備實例角色互換,原來的主變爲備實例,原來的備變爲主實例
  • 容災倒換命令不會解除容災關係

cke_180.png

4、災備升主

cke_181.png

可以通過災備升主,將容災備實例提升爲一個包含主DN的實例,使其可以對外提供服務,升主成功後,之前的容災關係將失效。

cke_182.png

5、容災解除

cke_183.png

  • 容災解除,是使得主實例清除維護的對端容災信息。
  • 清除後,主實例可以重新建立新的容災關係。

6、容災演練

1.準備兩個正常的實例

2.創建兩個實例的容災關係

cke_184.png

3.主實例發生嚴重故障

cke_185.png

4.對備實例進行升主,對外提供服務

cke_186.png

5.對主實例進行維修,然後執行容災解除

6.重新搭建容災關係

cke_187.png

7.進行容災倒換,恢復初始的容災關係

cke_188.png

六、GaussDB管理平臺實例監控告警

1、告警統計

實時告警與歷史告警:

  • 告警基本信息:告警id,告警名稱,告警類型,告警狀態類型、告警實例
  • 告警表現:告警時間、告警級別、告警描述、告警持續時間、告警節點IP、通知狀態
  • 告警數據分析:告警可能原因、影響、優化建議

cke_189.png

2、告警管理

cke_190.png

告警模板管理:默認模板包括默認文本模板以及默認JSON模板

3、監控大盤

列表看板:

通過將實例進行平鋪展示的方式,橫向對比各個實例的基本指標信息,包括CPU使用率、內存使用率等。

cke_191.png

趨勢看板:

cke_192.png

  • 展示單個實例的全方位詳細監控指標。
  • 指標範圍包括:CPU/內存、磁盤/存儲、網絡、連接、業務負載鎖、同步狀態、進程資源等。

希望本節課程對大家對GaussDB運維管理平臺的工具有所瞭解,歡迎大家共同學習交流。

 

點擊關注,第一時間瞭解華爲雲新鮮技術~

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章