高效開發測試打造產品化私有云

隨着越來越多的企業將雲計算產品應用到基礎設施及其核心業務中,如何提高和保證軟件交付質量、減少軟件開發迭代週期、加速軟件發佈頻率成爲所有云廠商面臨的關鍵問題。

根據IDC 2018年的預測,中國雲計算市場在未來5年將保持持續高速發展的態勢,主要表現爲:中國傳統的非雲計算IT基礎架構佔整體IT基礎架構的投入比例將從2018年的50.3%下降到2022年的40.7%;中國私有云平臺建設的市場規模將以年均24.8%的複合增長率快速增長;中國雲計算IT基礎架構支出佔全球市場比將從2018年的12%上升到2022年的25%。屆時,中國私有云IT基礎架構支出將超過美國,成爲全球第一大市場。在這一輪新的迭代更新中,更多企業和行業開始部署或者建立更大規模的私有云;而新應用(數據分析,AI,IoT,移動)和新場景(邊緣計算,智慧/平安城市,行業雲)也對雲平臺提出了更高需求。

ZStack提出雲計算的4S標準 – 簡單Simple,健壯Strong,彈性Scalable,智能Smart。同時,ZStack企業版從第一版發佈到最新的3.5.0版本,一直以每六週一次的週期迭代更新軟件版本,積極應對雲計算市場對私有云產品不斷增長的需求。而保證其私有云產品化的關鍵要素有以下三點:

1.流程 – 快速敏捷
2.運維 – 智能高效
3.測試 – 嚴謹全面

注:ZStack確保新需求六週便可實現

流程—快速敏捷

ZStack開發流程依然定義了傳統開發模式的幾個關鍵階段 - FF、CF、RC和GA。同時,針對不同階段的任務和目標進行優化。在Feature Freeze階段,主要以需求分析爲主,要求產品經理將客戶需求分片化、分級化,需求描述本地化,更有效地將需求安排到不同發佈版本週期中。開發和測試工程師則需要將Code Freeze和Release Candidate任務提前到Feature Freeze階段,減少互相之間任務的依賴,提高各個階段的併發度。測試不僅需要滲透到開發的每個環節,同時也要通過模型測試、路徑測試、穩定性測試等方法,提高代碼覆蓋度和測試效率。每個發佈週期反覆進行從需求到開發,再到測試的快速迭代,保證產品的新需求和問題始終能夠被快速滿足和解決。

注:ZStack產品開發流程高度併發,保證版本之間快速迭代

運維—智能高效

作爲私有云產品開發的基礎保證,一套快速、穩定、高併發、可伸縮的運維繫統是必要的。傳統運維提供的簡單CI和CD功能顯然無法滿足快速迭代的需求,ZStack產品化過程中,搭建了一套以ZStack + Kubernetes爲基礎、面向公司各部門的整體性服務框架。這套框架中所包括的服務內容涵蓋開發和測試人員使用的測試環境、到整個項目的管理工具。框架底層以ZStack作爲IaaS提供給上層可靠的、可擴展的物理資源,同時結合Kubernetes,將容器運行於雲主機中,既保證隔離性、又充分利用ZStack和Kubernetes對雲主機和Docker調度的優勢,起到對上層服務高可用、高併發及可伸縮的雙重保障。

注:ZStack作爲IaaS層向上層服務提供可靠的物理資源。更重要的是,內部ZStack環境也會隨着發佈版本更新。


注:實際生產環境中,一次自動化測試至少在Jenkins上併發創建500+個請求,每個請求包含10~50個測試用例,ZStack + Kubernetes保證這些請求幾秒內可以被處理

測試—嚴謹全面

打造一個產品化的私有云軟件需要全面且嚴謹的測試,這不僅僅是單元測試和集成測試能保證的。ZStack從以下四個方面入手強化測試:

測試高效化

整個產品流程中,開發和測試同步進行,這包括對不同開發分支需要有不同深度的測試代碼保證其質量——例如,對於Release分支,必須有持續性的Nightly測試把控每天進入的代碼質量;對於Feature分支,需要能快速檢測出patch對代碼核心功能影響的BAT測試。同時,測試系統和CI系統要高度集成並且做到同步觸發。

高效化的另一個重點是要做到所有測試都能運行在雲端,提高測試的併發度和資源利用率。ZStack內部測試均跑在雲端,而云端環境基於ZStack自身搭建,利用其對底層硬件資源的抽象和管理,模擬測試中需要的不同硬件配置場景,包括網絡、存儲、虛擬化平臺,甚至不同的ZStack高級功能配置,如企業管理、災備服務等。

同時,爲了滿足大規模資源需求的測試場景,例如1萬臺或10萬臺雲主機的測試場景,ZStack測試中還實現了simulator機制,即不真實分配硬件資源,而使用mock後端API的方式提供對後端資源的調配,真正做到有針對性的測試。

注:ZStack雲端測試的環境構建是通過XML配置文件實現的,測試工程師可以非常簡單地用幾分鐘配置出一臺自動化環境

測試標準化

ZStack所涵蓋的測試內容不僅包括功能性測試,還包括一套完整測試體系所需要的各種測試,如開發工程師需要做的集成/單元測試,測試工程師需要做的系統測試中的壓力、性能、可靠性測試、以及針對不同版本定製的發佈測試。例如,ZStack的可靠性測試包括兩類測試 – MTBF和DPMO測試,MTBF會對ZStack平臺進行15,000小時長時間的真實用戶操作模擬;DPMO測試則會對ZStack平臺進行高達10,000次的斷/上電、重啓等測試。

標準化的另一方面體現在對關鍵節點的標準把控上,對FF、CF、RC和GA各個階段都會有相應的代碼准入和驗收標準,例如CF階段後功能開發代碼禁止進入發佈分支而只能進入下一個發佈版本的週期;又例如各個階段驗收時要求的bug數量限制,CF階段要求小於5個P0,GA階段要求沒有P0的bug。

測試覆蓋智能化

軟件測試沒法達到100%的覆蓋率,所以我們要做的是在資源有限的情況下,以儘量少的代價做到儘可能高的覆蓋率。要提高覆蓋率,需從兩方面入手,一方面是對代碼進行覆蓋率檢查,我們在日常CI的包中插入了代碼不同模塊的覆蓋率,不管是手動還是自動測試,或是日常bug的驗證,都會爲覆蓋率提供數據。

另一方面我們增加了模型測試,它可以產生由隨機API組合構成的場景,會持續運行直到遇到預定義的退出條件或者找到一個缺陷。這種模型測試很好地彌補了人爲定義用例的不足,提高了測試場景和路徑的覆蓋率。由這種測試模型,也衍生出了三種不同場景的覆蓋率提高測試:

  • 覆蓋率測試:除常規有序的測試步驟外,運用模型測試,收集無序測試步驟下的測試覆蓋率。
  • MTBF測試: 從有序和無序兩種測試維度,對系統穩定性及可靠性進行測試。
  • 路徑測試: 通常一個系統測試用例最多5~6個操作步驟,而最終客戶的問題場景是極其複雜的,通常需要10~20個以上的步驟才能重現,運用模型測試的方法,可以有效減少構建測試用例的代碼量。

注:一個典型路徑測試,只需要將測試對象和操作步驟寫到測試用例中即可完成

報告立體化

主要從兩方面實現,一是測試報告的結果自動化、可讀化,是通過對測試用例中插入DITA描述實現的。另一方面是結果的可追溯和可回放,這是通過記錄測試過程中API的調用順序和參數實現的。

注:一個測試結果的操作記錄及回放方法,能夠有效幫助開發測試工程師重現bug

總結

作爲產品化的雲計算公司,ZStack自研了ZStack私有云、ZStack混合雲、ZStack Mini超融合一體機、ZStack CMP多雲管理平臺、ZStack企業級分佈式存儲等產品和方案。本文從開發流程、基礎運維以及測試能效等角度,介紹了ZStack 團隊如何高效打造一個產品化的私有云。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章