前言:
node_exporter用於監控*nux系統,使用go編寫的收集器
prometheus服務器:192.168.199.222
監控服務器 192.168.199.221
在192.168.199.221下載node_exporter
wget https://github.com/prometheus/node_exporter/releases/download/v*/node_exporter-*.*-amd64.tar.gz tar xvfz node_exporter-*.*-amd64.tar.gz cd node_exporter-*.*-amd64 ./node_exporter
起來後node_exporter會監控在9100端口,
可通過curl http://localhost:9100/metrics 或者瀏覽器輸入http://192.168.199.221:9100/metrics查看收集到的數據指標
使用文件服務發現的模式監控node_exporter,prometheus.yml添加配置如下(scrape_configs塊下添加):
- job_name: 'node' file_sd_configs: - files: ['/usr/local/prometheus/sd_config/node.yml'] refresh_interval: 5s
添加/usr/local/prometheus/sd_config/node.yml文件如下:
- targets: - 192.168.199.221:9100
來看prometheus ui
使用promql
監控192.168.199.221服務器cpu 5分鐘內的平均利用率
100-irate(node_cpu_seconds_total{job="node",mode="idle"}[5m])*100
內存使用率
100-(node_memory_MemFree_bytes+node_memory_Cached_bytes+node_memory_Buffers_bytes)/node_memory_MemTotal_bytes*100
磁盤使用率
100-node_filesystem_free_bytes{mountpoint="/"}/node_filesystem_size_bytes{mountpoint="/"}*100
修改node_exporter啓動命令,監控linux服務器的運行狀態
nohup ./node_exporter --collector.systemd --collector.systemd.unit-whitelist=(docker|sshd).service &
啓動後promql中會有node_systemd_unit_state。如圖