zabbix server 給agent 添加 CPU 監聽筆記

Configuration -> Host , 會顯示一個 Host 列表,如果列表中沒有監聽的服務器,可以通過點擊Create Host 新增一個Host

說明: 新增/編輯Hosts的標籤頁Host中的Agent interfacesIP adress 填寫被監聽的服務器ip,默認監聽的端口是10050

如:

uploads/200513/fs2020051300001v.jpg

uploads/200513/fs2020051300002W.jpg

爲了能夠監聽 zabbix agent的CPU使用情況,點擊上面圖片的Items菜單項,進入Items列表,

我照着Configuration -> Templates -> Template OS Linux裏面與CPU有關的Items資料輸入的。

如: CPU idle time

已有的項是:

uploads/200513/fs2020051300003J.jpg

我在被監聽的Host的Item 依葫蘆畫瓢式的新增Item,如下圖:

uploads/200513/fs2020051300004i.jpg

備註1: key 項,需要先點擊Select 按鈕,在彈出的窗口選擇一項, 如果選的項有參數,可以在key的文本框中編輯參數列表,如: 上圖的cpu idle time,步驟是:

  1. 點擊 select按鈕,在彈出的窗口選擇system.cpu.util[<cpu>,<type>,<mode>]

  2. key的文本框就會填入system.cpu.util[<cpu>,<type>,<mode>],然後在key的文本框中,將文本改爲system.cpu.util[,idle]

  3. 點擊保存之後,再回到被添加Item的Host中看 Items列表,可以看到添加的項的狀態是 Enable

    uploads/200513/fs2020051300005B.jpg

備註2: 上面添加的的key是可以通過zabbix server上的zabbix_get命令來試的,如

waka@ubuntus1:/usr/local/zabbix/bin$ ./zabbix_get -s 192.168.1.158 -p 10050 -k "system.cpu.util[,idle]"
99.616539

備註3: 如果在 Items 列表中的一項的狀態,顯示Not supported by Zabbix Agent,可以先用備註2的命令來試裏面的key是否可以獲取到資料,

如:

waka@ubuntus1:/usr/local/zabbix/bin$  ./zabbix_get -s 192.168.1.158 -p 10050 -k "system.cpu.util[<cpu>,<type>,<mode>]"
ZBX_NOTSUPPORTED
  1. 確認Item的key是正確的,用zabbix_get 命令試是否可以獲取資料開始新建Item時,裏面的key我是這樣直接的,沒有編輯,通過上面的命令,發現無法獲取到資料

  2. 使用zabbix_get 命令試,是可以獲取到資料,但是頁面還是顯示Not supported by Zabbix Agent

2.1. 等10分鐘之後,zabbix會去重新check一次當前item的Supported狀態
2.2. 刪掉當前item,重新創建一個
2.3. 修改zabbix重新check的時間,例如改成1分鐘,點擊 administration -> General -> 右側下拉條選擇 other, 編輯 Refresh unsupported items (in sec)的值,如60(單位爲秒)
uploads/200513/fs20200513000060.jpg

備註4: 如果出現以下的錯誤信息,需要在agent的服務器中啓動agent,如:sudo service zabbix-agent start

waka@ubuntus1:/usr/local/zabbix/bin$ ./zabbix_get -s 192.168.1.158 -p 10050 -k "system.uptime"
zabbix_get [1893]: Get value error: cannot connect to [[192.168.1.158]:10050]: [111] Connection refused

關於監聽CPU的項(簡要摘抄自參考文章2):

  1. user : CPU一共花了多少比例的時間運行在用戶態空間
  2. System: CPU花了多少比例的時間在內核空間運行
  3. Wait: CPU處於這種等待狀態的時間 (cpu is idle while waiting for an I/O operation to complete。The time the CPU spends in this state is shown by the wait statistic.)
  4. idle: CPU處於空閒狀態時間比例。一般而言,idel + user + nice 約等於100%
  5. nice: 可理解爲,用戶空間進程的CPU的調度優先級,範圍爲[-20,19]

在 zabbix server中新增的item的key有:

  1. steal: system.cpu.util[,steal]
  2. softirq:system.cpu.util[,softirq]
  3. interrupt:system.cpu.util[,interrupt]
  4. idle:system.cpu.util[,idle]
  5. user: system.cpu.util[,user]
  6. nice: system.cpu.util[,nice]
  7. system: system.cpu.util[,system]
  8. iowait:system.cpu.util[,iowait]

參考模板新建一個一樣的CPU utilization的圖表來顯示 客戶機(被監聽服務器)的CPU使用率

uploads/200513/fs2020051400001A.jpg

References

  1. zabbix:關於錯誤unsupported item key常見錯誤彙總
  2. 關於CPU的User、Nice、System、Wait、Idle各個參數的解釋
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章