使用iostat和LLD實現zabbix監控IO性能

本文主要分爲3個部分

第一部分 前言,主要說說需求和獲取數據的命令

第二部分 zabbix,主要說如何利用lld獲得想要監控的數據

第三部分 ansible,主要提供一個ansible playbook來分發該監控所需的文件

第一部分 前言部分

最近有一個需求是對系統的IO進行監控,最後決定從iostat獲取數據。

這是具體的命令:

iostat -x -d -m 1 3

參數簡單解析:

-x     Display  extended statistics 

-d     Display the device utilization report

-m     Display statistics in megabytes per second instead of blocks or kilobytes per second


那麼爲什麼要 1 3呢?

我們用

iostat -x -d -m 1

多次測試,會發現第一次輸出的值變動不大,第二次,第三次輸出的值會有一定的變化,因此我更偏向與取第二次,第三次的值做平均

命令的輸出格式如下:

Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await  svctm  %util

可以較好地滿足我們的監控需求


第二部分 zabbix部分

接下來,我們就用zabbix的LLD來自動發現當前系統的Device值

cat /etc/zabbix/scripts/io_discovery.py

#!/bin/env python
import os
import commands
(status,output) = commands.getstatusoutput("iostat -x -d -m  | sed -n '4,$p' | grep -v ^$|  awk '{print $1}'")
DISKS = output.split()
print '{'
print '\t"data":['
count = 1
for key in DISKS:
    print '\t{'
    if count < len(DISKS):
        print '\t\t"{#DISK}":"%s"},' % key
    else:
        print '\t\t"{#DISK}":"%s"}' % key
    count += 1
print '\t]'
print '}'


拿到Device以後,用腳本來獲取對應的數值

cat /etc/zabbix/scripts/userparameter_diskio.py

#!/bin/env python
import commands
import sys

DISK = sys.argv[1]
cmdline = 'cat /tmp/iostat.txt | grep %s' % DISK
(status,output) = commands.getstatusoutput(cmdline)
output_list = output.split()
value = zip(*[iter(output_list)]*12)

if sys.argv[2] == "rrqmps":
    print ((float(value[1][1])+float(value[2][1]))/2)
elif sys.argv[2] == "wrqmps":
    print ((float(value[1][2])+float(value[2][2]))/2)
elif sys.argv[2] == "rps":
    print ((float(value[1][3])+float(value[2][3]))/2)
elif sys.argv[2] == "wps":
    print ((float(value[1][4])+float(value[2][4]))/2)
elif sys.argv[2] == "rspeed":
    print ((float(value[1][5])+float(value[2][5]))/2)
elif sys.argv[2] == "wspeed":
    print ((float(value[1][6])+float(value[2][6]))/2)
elif sys.argv[2] == "await":
    print ((float(value[1][9])+float(value[2][9]))/2)
elif sys.argv[2] == "svctm":
    print ((float(value[1][10])+float(value[2][10]))/2)
elif sys.argv[2] == "util":
    print ((float(value[1][11])+float(value[2][11]))/2)

這裏還需要一個crontab來生成/tmp/iostat.txt文件

* * * * * iostat -x -d -m 1 3 > /tmp/iostat.txt


接着寫一個自定義配置文件

cat /etc/zabbix/zabbix_agentd.d/userparameter_diskio.conf

UserParameter=diskio_discovery[*],python /etc/zabbix/scripts/io_discovery.py
UserParameter=diskio[*],python /etc/zabbix/scripts/userparameter_diskio.py  $1 $2


接下來需要在zabbix上建一個監控模板,模板在附件裏面,本模板適用於zabbix3.2,其他版本請自行測試,可能需要做一些修改


都準備以後可以開始使用了

首先把相應的腳本和配置文件放到客戶機上面,添加cron

接着把模板導入,在模板裏面添加機器,然後restart zabbix 客戶端


第三部分 Ansible部分

如果你有使用ansible,這裏可以提供一個playbook,用來分發腳本等工作

- hosts: 客戶機
  tasks:
    - name: mkdir the scripts dir 
      file: path=/etc/zabbix/scripts state=directory
    - name: copy conf files
      copy: src=/etc/zabbix/zabbix_agentd.d/userparameter_diskio.conf   dest=/etc/zabbix/zabbix_agentd.d/
    - name: copy io_discovery.py 
      copy: src=/etc/zabbix/scripts/io_discovery.py   dest=/etc/zabbix/scripts/io_discovery.py mode=0755
    - name: copy userparameter_diskio.py 
      copy: src=/etc/zabbix/scripts/userparameter_diskio.py   dest=/etc/zabbix/scripts/userparameter_diskio.py mode=0755
    - name: add cron
      cron: name='add iostat cron'  minute='*' hour='*' day='*' month='*' weekday='*' job='iostat -x -d -m 1 3 > /tmp/iostat.txt' state=present
      notify:
      - restart zabbix-agent
  handlers:
    - name: restart zabbix-agent
      service: name=zabbix-agent state=restarted enabled=yes



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章