protheus hang住的问题，卡在TSDB过程中无法启动

原創

2020-05-01 12:21

问题：k8s发生pods迁移，prometheus重启，重启过程中CPU和内存同时疯狂增加，最后报pods网络问题。
错误分析：
prometheus TSDB写错误，所以重启会疯狂攫取CPU内存资源，最后也无法读取TSDB数据，最终把节点系统资源耗尽，影响别的服务。
以至于在此错误理解下，在prometheus部署服务中加了limits选项，限制CPU为3.memory为20Gi.本意是为了保护系统资源，其实是进入了一个误区，prometheus重新组合需要的系统资源不够，反而造成prometheus无法启动。
正确理解：
protheus重启需要组合大量的TSDB资源，CPU会瞬间增加到13核左右，并需要大概50G 内存资源。此刻组合DB资源的过程中，kubelet会反馈pods网络连接问题，实际上是假象，prometheus已经提供服务了。
解决：

prometheus部署到CPU和内存比较大的节点上。
prometheus limits资源要给大点limits限制cpu:20 ,memory:100Gi
遇到pods报网络错误可忽略，稍等几分钟会恢复正常。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

电脑宕机后恢复K8s Pod启动

1. 先開機看看集羣狀態是不是正常的 kubectl get cs 2. 看看pod狀態： kubectl -n xxx get pod 3. 進到nfs目錄內modeling mariab的文件夾 /dockerdata-nfs 4

2020-07-08 11:16:26

k8s(二)

2020-07-08 10:26:30

利用 kubeadm 简单搭建k8s（已更新为V1.13.0版本）

1. 基本系統環境 1.1 系統內核查看當前系統內核（我這裏是5.0.5-1.el7.elrepo.x86_64）： uname -a 版本必須大於等於3.10，否則需要升級內核： # ELRepo 倉庫(可以先看一下 /et

2020-07-08 10:04:33

3.2 控制器——副本控制器（ReplicationController）

3.2 副本控制器（ReplicationController） ReplicationController（在kubectl命令中經常縮寫爲rc或rcs）是實際確保特定數量的Pod副本在任意時刻的運行。如果Pod副本超過指定數

2020-07-08 10:04:33

3.5 控制器——DaemonSet（守护线程集）

3.5 控制器——DaemonSet（守護線程集）每個DaemonSet可以確保某些甚至全部節點運行一個Pod的副本，當node加入集羣時，Pod就會加入這些節點，同樣的，當節點從集羣中移除時，這些pods被垃圾回收。刪除一個

2020-07-08 10:04:33

3.3 控制器——Deployments（部署）

3.3 Deployments（部署） Deployments控制器（Deployment controller，Deployment應該也是控制器的一種吧）提供了Pod和ReplicaSets的聲明式更新。在Deploymen

2020-07-08 10:04:33

3.1 控制器——ReplicaSet

3. 控制器（Controller） 3.1 副本集（ReplicaSet）定義：副本集（ReplicaSet）的目的是爲了保證一組穩定的Pod副本在任意給定時刻都在運行。因此，它通常用於保證特定數量的相同Pod的可用性。副

2020-07-08 10:04:33

centos7搭建kubernetes v1.17.1集群

機器 hostname 10.211.55.64 k8sMaster 10.211.55.65 k8sNode1 10.211.55.66 k8sNode2 所有機器執行以下操作 (1-13) 配置y

夜幕.思年华

2020-07-08 06:16:44

云原生Tekton之触发器Trigger

背景前面的文章講了tekton中pipeline的教程和使用案例，大家有沒有想過，每次都要運行taskrun或者pipelineRun才能真正運行流水線。那怎麼做到自動化執行taskrun和pipelineRun呢？我想了下有

云原生手记

2020-07-08 03:27:17

kubernetes -- 结点调度控制的几种方式

簡介調度器通過 kubernetes 的 watch 機制來發現集羣中新創建且尚未被調度到 Node上的 Pod。調度器會將發現的每一個未調度的 Pod 調度到一個合適的 Node 上來運行。 kube-scheduler 是

生命热力٩( 'ω' )و

2020-07-08 02:17:36

k8s创建资源的两种方式、访问pod

創建資源 1.用kubectl命令直接創建， #kubectl run httpd-app --image=reg.yunwei.edu/learn/httpd:latest --replicas=2 在命令行中通過參數指定資源的

2020-07-08 01:52:27

O-RAN notes(3)---Bronze SMO deployment (2)

(continued) Most of the problems are related to 'docker pull'. Before you execute the install script(./dep/smo/bin/inst

2020-07-07 23:48:07

centos安装k8s集群

一、集羣方式機器配置：centos 4.4內核以上，cpu大於1核 1.主機配置配置規格內存配置 2G CPU配置 2核系統版本 Centos7.7 kubelet版本 1.5.1 do

2020-07-07 18:12:18

kubernetes存储 -- Volumes管理（三）StatefulSet控制器、StatefulSet部署mysql主从集群

StatefulSet控制器 StatefulSet可以通過Headless Service維持Pod的拓撲狀態. StatefulSet將應用狀態抽象成了兩種情況: 拓撲狀態:應用實例必須按照某種順序啓動。新創建的Pod必須

生命热力٩( 'ω' )و

2020-07-07 02:59:20

使用kubeadm安装kubenetes1.17.3

我們使用centos7的系統，內核升級到5.5.4，爲什麼使用升級後的內核，這是因爲centos7.4的內核是3.10，在docker運行時，有內核bug，導致運行緩慢，出現一堆錯誤異常，可以查閱我另外一個博客文章。一、安裝前的準備工作

2020-07-07 01:26:46

24小時熱門文章

最新文章

最新評論文章