protheus hang住的問題，卡在TSDB過程中無法啓動

原創

2020-05-01 12:21

問題：k8s發生pods遷移，prometheus重啓，重啓過程中CPU和內存同時瘋狂增加，最後報pods網絡問題。
錯誤分析：
prometheus TSDB寫錯誤，所以重啓會瘋狂攫取CPU內存資源，最後也無法讀取TSDB數據，最終把節點系統資源耗盡，影響別的服務。
以至於在此錯誤理解下，在prometheus部署服務中加了limits選項，限制CPU爲3.memory爲20Gi.本意是爲了保護系統資源，其實是進入了一個誤區，prometheus重新組合需要的系統資源不夠，反而造成prometheus無法啓動。
正確理解：
protheus重啓需要組合大量的TSDB資源，CPU會瞬間增加到13核左右，並需要大概50G 內存資源。此刻組合DB資源的過程中，kubelet會反饋pods網絡連接問題，實際上是假象，prometheus已經提供服務了。
解決：

prometheus部署到CPU和內存比較大的節點上。
prometheus limits資源要給大點limits限制cpu:20 ,memory:100Gi
遇到pods報網絡錯誤可忽略，稍等幾分鐘會恢復正常。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

電腦宕機後恢復K8s Pod啓動

1. 先開機看看集羣狀態是不是正常的 kubectl get cs 2. 看看pod狀態： kubectl -n xxx get pod 3. 進到nfs目錄內modeling mariab的文件夾 /dockerdata-nfs 4

2020-07-08 11:16:26

k8s(二)

2020-07-08 10:26:30

利用 kubeadm 簡單搭建k8s（已更新爲V1.13.0版本）

1. 基本系統環境 1.1 系統內核查看當前系統內核（我這裏是5.0.5-1.el7.elrepo.x86_64）： uname -a 版本必須大於等於3.10，否則需要升級內核： # ELRepo 倉庫(可以先看一下 /et

2020-07-08 10:04:33

3.2 控制器——副本控制器（ReplicationController）

3.2 副本控制器（ReplicationController） ReplicationController（在kubectl命令中經常縮寫爲rc或rcs）是實際確保特定數量的Pod副本在任意時刻的運行。如果Pod副本超過指定數

2020-07-08 10:04:33

3.5 控制器——DaemonSet（守護線程集）

3.5 控制器——DaemonSet（守護線程集）每個DaemonSet可以確保某些甚至全部節點運行一個Pod的副本，當node加入集羣時，Pod就會加入這些節點，同樣的，當節點從集羣中移除時，這些pods被垃圾回收。刪除一個

2020-07-08 10:04:33

3.3 控制器——Deployments（部署）

3.3 Deployments（部署） Deployments控制器（Deployment controller，Deployment應該也是控制器的一種吧）提供了Pod和ReplicaSets的聲明式更新。在Deploymen

2020-07-08 10:04:33

3.1 控制器——ReplicaSet

3. 控制器（Controller） 3.1 副本集（ReplicaSet）定義：副本集（ReplicaSet）的目的是爲了保證一組穩定的Pod副本在任意給定時刻都在運行。因此，它通常用於保證特定數量的相同Pod的可用性。副

2020-07-08 10:04:33

centos7搭建kubernetes v1.17.1集羣

機器 hostname 10.211.55.64 k8sMaster 10.211.55.65 k8sNode1 10.211.55.66 k8sNode2 所有機器執行以下操作 (1-13) 配置y

夜幕.思年华

2020-07-08 06:16:44

雲原生Tekton之觸發器Trigger

背景前面的文章講了tekton中pipeline的教程和使用案例，大家有沒有想過，每次都要運行taskrun或者pipelineRun才能真正運行流水線。那怎麼做到自動化執行taskrun和pipelineRun呢？我想了下有

云原生手记

2020-07-08 03:27:17

kubernetes -- 結點調度控制的幾種方式

簡介調度器通過 kubernetes 的 watch 機制來發現集羣中新創建且尚未被調度到 Node上的 Pod。調度器會將發現的每一個未調度的 Pod 調度到一個合適的 Node 上來運行。 kube-scheduler 是

生命热力٩( 'ω' )و

2020-07-08 02:17:36

k8s創建資源的兩種方式、訪問pod

創建資源 1.用kubectl命令直接創建， #kubectl run httpd-app --image=reg.yunwei.edu/learn/httpd:latest --replicas=2 在命令行中通過參數指定資源的

2020-07-08 01:52:27

O-RAN notes(3)---Bronze SMO deployment (2)

(continued) Most of the problems are related to 'docker pull'. Before you execute the install script(./dep/smo/bin/inst

2020-07-07 23:48:07

centos安裝k8s集羣

一、集羣方式機器配置：centos 4.4內核以上，cpu大於1核 1.主機配置配置規格內存配置 2G CPU配置 2核系統版本 Centos7.7 kubelet版本 1.5.1 do

2020-07-07 18:12:18

kubernetes存儲 -- Volumes管理（三）StatefulSet控制器、StatefulSet部署mysql主從集羣

StatefulSet控制器 StatefulSet可以通過Headless Service維持Pod的拓撲狀態. StatefulSet將應用狀態抽象成了兩種情況: 拓撲狀態:應用實例必須按照某種順序啓動。新創建的Pod必須

生命热力٩( 'ω' )و

2020-07-07 02:59:20

使用kubeadm安裝kubenetes1.17.3

我們使用centos7的系統，內核升級到5.5.4，爲什麼使用升級後的內核，這是因爲centos7.4的內核是3.10，在docker運行時，有內核bug，導致運行緩慢，出現一堆錯誤異常，可以查閱我另外一個博客文章。一、安裝前的準備工作

2020-07-07 01:26:46

24小時熱門文章

最新文章

最新評論文章