問題:部署了node-gpu-exporter,prometheus卻無法手機信息,報context deadline exceeded。
解決:
網上好多介紹說改prometheus的配置scrape_timeout:600s,加大參數即可。
實際上沒不好使。
最後加大exporter的資源限制解決。
resources:
requests:
memory: 30Mi
cpu: 100m
limits:
memory: 200Mi
cpu: 500m
參考:https://github.com/prometheus/prometheus/issues/2459