在騰訊雲容器服務 TKE 中利用 HPA 實現業務的彈性伸縮

原創

2021-01-30 10:29

概述

Kubernetes Pod 水平自動擴縮（Horizontal Pod Autoscaler，以下簡稱 HPA）可以基於 CPU 利用率、內存利用率和其他自定義的度量指標自動擴縮 Pod 的副本數量，以使得工作負載服務的整體度量水平與用戶所設定的目標值匹配。本文將介紹和使用騰訊雲容器服務 TKE 的 HPA 功能實現 Pod 自動水平擴縮容。

使用場景

HPA 自動伸縮特性使容器服務具有非常靈活的自適應能力，能夠在用戶設定內快速擴容多個 Pod 副本來應對業務負載的急劇飆升，也可以在業務負載變小的情況下根據實際情況適當縮容來節省計算資源給其他的服務，整個過程自動化無須人爲干預，非常適合服務波動較大，服務數量多且需要頻繁擴縮容的業務場景，如：電商服務、線上教育、金融服務等。

原理概述

Pod 水平自動擴縮特性由 Kubernetes API 資源和控制器實現。資源利用指標決定控制器的行爲，控制器會週期性的根據 Pod 資源利用情況調整服務 Pod 的副本數量，以使得工作負載的度量水平與用戶所設定的目標值匹配。其擴縮容流程和說明如下：

提示：目前這一功能處於 beta 版本，且 Pod 自動水平擴縮不適用於無法擴縮的對象，比如 DaemonSet 資源。

HPA Controller：控制 HPA 擴縮邏輯的控制組件。

Metrics Aggregator：度量指標聚合器。通常情況下，控制器將從一系列的聚合 API（metrics.k8s.io、custom.metrics.k8s.io 和 external.metrics.k8s.io）中獲取度量值。 metrics.k8s.io API 通常由 Metrics 服務器提供，社區版可提供基本的 CPU、內存度量類型，相比於社區版，TKE 使用自定義 Metrics Server 採集可支持更廣泛的的 HPA 的度量指標觸發類型，提供包括 CPU 、內存、硬盤、網絡和 GPU 相關指標，瞭解更多詳細內容參閱 TKE 自動伸縮指標說明。

提示：控制器也可以直接從 Heapster 獲取指標。但自 Kubernetes 1.11 起，從 Heapster 獲取指標特性的方式已廢棄。

HPA 計算目標副本數算法：TKE HPA 擴縮容算法請參考工作原理，更多詳細算法請參閱算法細節。

前提條件

已註冊騰訊雲賬戶。
已登錄騰訊雲容器服務控制檯。
已創建 TKE 集羣。關於創建集羣，詳情請參見創建集羣。

操作步驟

第 1 步：部署測試工作負載

以 Deployment 資源類型的工作負載爲例，創建一個單副本數，服務類型爲 WEB 服務的 "hpa-test" 工作負載，在 TKE 控制檯創建Deployment 類型工作負載方法請參閱 Deployment 管理。本示例創建結果如下圖所示：

第 2 步：配置 HPA

在 TKE 控制檯爲測試工作負載綁定一個 HPA 配置，關於如何綁定配置 HPA 請參閱 HPA 操作步驟，本示例配置當網絡出帶寬達到0.15Mbps（150Kbps）時觸發擴容的策略。

第 3 步：功能驗證

在集羣中啓動一個臨時 Pod 對配置的 HPA 功能進行測試（模擬客戶端）：

kubectl run -it --image alpine hpa-test --restart=Never --rm /bin/sh

在臨時 Pod 中運行下面命令短時間內模擬大量請求訪問 "hpa-test" 服務使出口流量帶寬增大：

# hpa-test.default.svc.cluster.local 爲服務在集羣中的域名，當需要停止腳本時按 Ctrl+C 即可
while true; do wget -q -O - hpa-test.default.svc.cluster.local; done

在測試 Pod 中執行模擬請求命令後，通過觀察下圖中工作負載的 Pod 數量監控可以看到，在 16:21 分時工作負載擴容副本數量至 2 個，由此可推斷出已經觸發了 HPA 的擴容事件。

再通過下圖的工作負載的網絡出口帶寬監控可以看出在 16:21 右左時網絡出口帶寬增至大概 199 Kbps，已經超過 HPA 設定的網絡出口帶寬目標值，進一步證明此時觸發 HPA 擴縮容算法擴容了一個副本數來滿足設定的目標值，故工作負載的副本數量變成了 2 個。

注意：HPA 擴縮容算法不只以公式計算維度去控制擴縮容邏輯，而會多維度去衡量是否需要擴容或縮容，詳情可以參閱算法細節，所以在實際情況中可能和預期會稍有偏差。

接下來模擬縮容過程，在 16：24 左右手動停止執行模擬請求的命令，從下圖監控看到此時網絡出口帶寬值下降到擴容前位置，按照 HPA 的邏輯，此時已經滿足工作負載縮容的條件。

但從下圖工作負載的 Pod 數量監控可以看出，工作負載在 16:30 分時才觸發了 HPA 的縮容，這是因爲觸發了 HPA 縮容有默認 5 分鐘的容忍時間的算法，以防止度量指標短時間波動導致的頻繁的擴縮容，詳情請參閱冷卻/延遲支持。從下圖可以看出工作負載副本數在停止命令 5 分鐘後按照 HPA 擴縮容算法縮容到了最初設定的 1 個副本數。

當 TKE 發生 HPA 擴縮容事件時，會在對應的 HPA 實例的事件列表展示，如下圖所示。需要注意的是事件通知列表的時間分爲 “首次出現時間” 和 “最後出現時間”，“首次出現時間” 表示相同事件第一次出現的時間，”最後出現時間” 爲相同事件出現的最新時間，所以從下圖事件列表 “最後出現時間” 字段可以看到本示例擴容事件時間點是16:21:03，縮容事件時間是16.29:42，時間點與工作負載監控看到的時間點相吻合。

此外，工作負載事件列表也會記錄 HPA 發生時工作負載的增刪副本數事件，從下圖可以看出工作負載擴縮容時間點與 HPA 事件列表的時間點也是吻合的，增加副本數時間點是 16:21:03，減少副本數時間點是 16: 29:42。

總結

在本示例中主要演示了 TKE 的 HPA 功能，使用 TKE 自定義的網絡出口帶寬度量類型作爲工作負載 HPA 的擴縮容度量指標，當工作負載實際度量值超過 HPA 配置的度量目標值時， HPA 根據擴容算法計算出合適的副本數實現水平擴容，保證工作負載的度量指標滿足預期，保障工作負載健康穩定運行；當實際度量值遠低於 HPA 配置的度量目標值時，HPA 會在容忍時間後計算合適的副本數實現水平縮容，適當釋放閒置資源，達到提升資源利用率的目的，並且整個過程在 HPA 和工作負載事件列表都會有相應的事件記錄，使整個工作負載水平擴縮容全程可追溯。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

在騰訊雲容器服務 TKE 中利用 HPA 實現業務的彈性伸縮

概述

使用場景

原理概述

前提條件

操作步驟

總結

NETCore中實現一個輕量無負擔的極簡任務調度ScheduleTask

docker使用特定的網絡

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

容器中nginx無法使用同一個網絡下的容器域名

避免DbContext同時在多個線程調用

Python: SunMoonTimeCalculator

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

重磅：Python/Java/C 2020年之爭！誰是你心中的NO.1？

新零售的未來智能移動機器人將發揮哪些作用？

通過編寫“猜數字”遊戲學習 Lua

網工學習必備筆記——VLAN路由-三層交換

【一看】看圖說話之瓶頸

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結