雲上 TiDB 管理「利器」,TiDB Operator 1.0 GA 發佈

去年八月份,我們 開源了 TiDB Operator 項目,以實現 TiDB 在 Kubernetes 上的部署和運維。開源後到現在的近一年內,我們一方面基於用戶反饋不斷打磨項目的易用性,另一方面通過嚴苛的穩定性測試持續提升可靠性。今天,我們自豪地宣佈 TiDB Operator 1.0 GA 正式發佈!

TiDB Operator architecture

<center>TiDB Operator architecture</center>

TiDB Operator 是 Kubernetes 上的 TiDB 集羣自動運維繫統。提供包括部署、升級、擴縮容、備份恢復、配置變更的 TiDB 全生命週期管理。藉助 TiDB Operator,TiDB 可以無縫運行在公有云或私有部署的 Kubernetes 集羣上。

1.0 是 TiDB Operator 的首個 GA 版本,具備以下核心亮點。

核心亮點

1. 簡化 TiDB 運維管理

TiDB 是一個複雜的分佈式系統,它的部署和運維需要比較深入的領域知識,這帶來了頗高的學習成本和負擔。TiDB Operator 則通過自定義資源對象(Custom Resource)、自定義控制器(Custom controller)和調度器擴展(Scheduler extender)爲 Kubernetes 注入 TiDB 的專業運維知識,允許用戶以 Kubernetes 的聲明式 API 風格來管理 TiDB 集羣。具體來說,用戶只需要描述集羣規格,TiDB Operator 就會不斷調整 Kubernetes 中的資源,驅動實際集羣滿足該描述。在這種模式下,TiDB 集羣會自動完成服務的健康檢查、故障轉移,而部署、升級、擴縮容等操作則能通過修改集羣的規格定義“一鍵”完成,極大簡化了 TiDB 集羣的運維管理。

更重要的是,標準化的集羣管理 API 允許用戶完成內部工具鏈或 PaaS 平臺與 TiDB 集羣管理的深度整合,真正賦能用戶玩轉 TiDB。

2. 穩定可靠

作爲數據庫,TiDB 往往處於整個系統架構中的最核心位置,對於穩定性有着嚴苛要求。這同樣也是對 TiDB Operator 的要求。爲了確保所有自動化運維操作的穩定可靠,我們爲 TiDB Operator 專門設計了穩定性測試,在施加較大讀寫負載的同時,不斷進行各類運維操作並模擬主機、容器、磁盤、網絡、Kubernetes 組件和 TiDB Operator 組件的各類故障,觀察在這些場景下 TiDB Operator 的行爲是否符合預期。通過 7 * 24 小時不間斷運行穩定性測試,我們發現並修復了諸多極端的邊界情況。在 1.0 發佈前,TiDB Operator 穩定性測試已經穩定運行數月。

3. 多雲支持

1.0 提供了面向 AWS、谷歌雲和阿里雲的 Terraform 部署腳本。 這些腳本能幫助大家在十幾分鍾內創建一個 Kubernetes 集羣,並在該集羣上部署一個或更多生產可用的 TiDB 集羣。在後續的管理過程中,Terraform 腳本會在操作 TiDB 集羣的同時對相關的雲資源進行操作。比如,當擴容一個 TiDB 集羣時,Terraform 腳本就會自動創建更多的雲服務器來承載集羣擴容後的資源需求。

體驗 TiDB Operator

大家可以通過 Terraform 在 AWS(部署文檔)、谷歌雲(部署文檔)、阿里雲(部署文檔)上快速部署 TiDB Operator 以及下屬的 TiDB 集羣,也可以參考 通用 Kubernetes 部署文檔 在任何 Kubernetes 集羣上部署並體驗 TiDB Operator。

對於 Pre GA 版本的用戶,請參考 1.0 Release Note 瞭解 1.0 的變更內容和升級指南。

致謝

感謝所有 TiDB Operator 的貢獻者(https://github.com/pingcap/tidb-operator/graphs/contributors),1.0 能夠走到 GA 離不開每一位貢獻者的努力!

最後歡迎大家爲 TiDB Operator 提交 issue 或參考貢獻文檔開始提交代碼,TiDB Operator 期待大家的參與和反饋!

閱讀原文https://pingcap.com/blog-cn/tidb-operator-1.0-ga/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章