Go开发属于自己的exporter

使用go开发一个自己的exporter

github地址:https://github.com/strive-after/demo-exporter

此项目借鉴了社区提供的mysql exporter 以及zhangguanzhang的harbor_exporter

https://github.com/zhangguanzhang/harbor_exporter

https://github.com/prometheus/mysqld_exporter

一、Prometheus的基本指标类型

1、 Counter:只增不减的累加指标

Counter就是一个计数器,表示一种累积型指标,该指标只能单调递增或在重新启动时重置为零,例如,您可以使用计数器来表示所服务的请求数,已完成的任务或错误。

2、 Gauge:可增可减的测量指标

Gauge是最简单的度量类型,只有一个简单的返回值,可增可减,也可以set为指定的值。所以Gauge通常用于反映当前状态,比如当前温度或当前内存使用情况;当然也可以用于“可增加可减少”的计数指标。

3、Histogram:自带buckets区间用于统计分布的直方图

Histogram主要用于在设定的分布范围内(Buckets)记录大小或者次数。

例如http请求响应时间:0-100ms、100-200ms、200-300ms、>300ms 的分布情况,Histogram会自动创建3个指标,分别为:

事件发送的总次数:比如当前一共发生了2次http请求
所有事件产生值的大小的总和:比如发生的2次http请求总的响应时间为150ms
事件产生的值分布在bucket中的次数:比如响应时间0-100ms的请求1次,100-200ms的请求1次,其他的0次
4、Summary:数据分布统计图

Summary和Histogram类似,都可以统计事件发生的次数或者大小,以及其分布情况。

Summary和Histogram都提供了对于事件的计数_count以及值的汇总_sum,因此使用_count,和_sum时间序列可以计算出相同的内容。

同时Summary和Histogram都可以计算和统计样本的分布情况,比如中位数,n分位数等等。不同在于Histogram可以通过histogram_quantile函数在服务器端计算分位数。 而Sumamry的分位数则是直接在客户端进行定义。因此对于分位数的计算。 Summary在通过PromQL进行查询时有更好的性能表现,而Histogram则会消耗更多的资源。相对的对于客户端而言Histogram消耗的资源更少。

二、开发exporter

1.exporter简介

既然我们已经了解了prometheus的指标类型,那么可以思考我们是不是只需要把指标采集并且做成prometheus支持的格式,类似于图中的格式
在这里插入图片描述
2.首先介绍一下基本的目录结构

在这里插入图片描述

man函数作为总入口 提供web url /metrices以及访问/的时候提供一些基本介绍

collector作为控制器端

里面会有exporter的基本属性以及指标采集过程

3.代码简介

(1)mai n.go

package main

import (
   "flag"
   "github.com/prometheus/client_golang/prometheus"
   "github.com/prometheus/client_golang/prometheus/promhttp"
   log "github.com/sirupsen/logrus"
   "myexporter/collector"
   "net/http"
   "strings"
)

var (
   metricsPath string = "https://github.com/strive-after/demo-exporter"
   version string = "v1.0"
   listenAddress string
   help bool
   disable  string  //命令行传入的需要关闭的指标
   disables  []string   //处理命令行传入的根据,分割为一个切片做处理
)

func init()  {
   flag.StringVar(&listenAddress,"addr",":8080","addr")
   flag.BoolVar(&help,"h",false,"help")
   flag.StringVar(&disable,"disable","","关闭的指标收集器")
}




func main() {
   flag.Parse()
   if help {
      flag.Usage()
      return
   }
   disables = strings.Split(disable,",")
   //手动开关
   //通过用户输入的我们做关闭
   for scraper ,_:= range collector.Scrapers {
      for _,v := range disables {
         if v == scraper.Name() {
            collector.Scrapers[scraper] = false
            break
         }
      }
   }

   //访问/的时候返回一些基础提示
   http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
      w.Write([]byte(`<html>
             <head><title>` + collector.Name() + `</title></head>
             <body>
             <h1><a style="text-decoration:none" href=''>` + collector.Name() + `</a></h1>
             <p><a href='` + metricsPath + `'>Metrics</a></p>
             <h2>Build</h2>
             <pre>` + version + `</pre>
             </body>
             </html>`))
   })
   //根据开关来判断指标的是否需要收集  这里只有代码里面的判断  用户手动开关还未做
   enabledScrapers := []collector.Scraper{}
   for scraper, enabled := range collector.Scrapers {
      if enabled {
         log.Info("Scraper enabled ", scraper.Name())
         enabledScrapers = append(enabledScrapers, scraper)
      }
   }

   //注册自身采集器
   exporter := collector.New(collector.NewMetrics(),enabledScrapers)
   prometheus.MustRegister(exporter)

   http.Handle("/metrics", promhttp.Handler())
   //监听端口
   if err := http.ListenAndServe(listenAddress, nil); err != nil {
      log.Printf("Error occur when start server %v", err)
   }
}

main主要提供了2个url 以及提供指标采集的开关 用户通过手动或者我们代码中控制 来做指标收集的开关比如某些指标不想要我们想舍弃就可以通过-disable来控制关闭 也可以在代码中修改, 后续会介绍代码中修改方式

(2)switch.go

package collector

var (
   Scrapers = map[Scraper]bool{
      CpuLoad{}: true,
   }
)

这里就做了开关控制我们在代码中实现就是通过修改这个bool值来做 每当我们添加一个指标 需要在map中添加一个指标的name 以及bool 添加指标后续会介绍

(3)exporter.go

package collector

import (
   "github.com/prometheus/client_golang/prometheus"
   log "github.com/sirupsen/logrus"
   "sync"
)

var (
   name string= "test_exporter"
   namespace string = "test"
   exporter string = "exporter"
)

func Name() string {
   return  name
}

type Exporter struct {
   metrics Metrics
   scrapers []Scraper
}

type Metrics struct {
   //收集指标的总次数
   TotalScrapes prometheus.Counter
   //收集指标中发生错误的次数
   ScrapeErrors *prometheus.CounterVec
   //最后一次是否发生了错误
   Error        prometheus.Gauge
}

//fqname会把namespace subsystem name拼接起来
//传入动态以及静态标签 设置标签
func NewDesc(subsystem, name, help string,movinglabel []string ,label prometheus.Labels) *prometheus.Desc {
   return prometheus.NewDesc(
      prometheus.BuildFQName(namespace, subsystem, name),
      help, movinglabel, label,
   )
}
//判断*exporter是否实现了collector这个接口的所有方法
var  _ prometheus.Collector = (*Exporter)(nil)

func New(metrics Metrics, scrapers []Scraper) *Exporter{
   return &Exporter{
      metrics: metrics,
      scrapers: scrapers,
   }
}

func NewMetrics() Metrics {
   subsystem := exporter
   return Metrics{
      TotalScrapes: prometheus.NewCounter(prometheus.CounterOpts{
         Namespace: namespace,
         Subsystem: subsystem,
         Name:      "scrapes_total",
         Help:      "Total number of times  was scraped for metrics.",
      }),
      ScrapeErrors: prometheus.NewCounterVec(prometheus.CounterOpts{
         Namespace: namespace,
         Subsystem: subsystem,
         Name:      "scrape_errors_total",
         Help:      "Total number of times an error occurred scraping .",
      }, []string{"collector"}),
      Error: prometheus.NewGauge(prometheus.GaugeOpts{
         Namespace: namespace,
         Subsystem: subsystem,
         Name:      "last_scrape_error",
         Help:      "Whether the last scrape of metrics  resulted in an error (1 for error, 0 for success).",
      }),
   }
}


//添加描述符
func (e *Exporter) Describe(ch chan <-  *prometheus.Desc) {
   ch <- e.metrics.TotalScrapes.Desc()
   ch <- e.metrics.Error.Desc()
   e.metrics.ScrapeErrors.Describe(ch)
}

//收集指标
func (e *Exporter) Collect(ch chan <- prometheus.Metric) {
   e.scrape(ch)
   ch <- e.metrics.TotalScrapes
   ch <- e.metrics.Error
   e.metrics.ScrapeErrors.Collect(ch)
}
//通过例程并发的收集指标 需要加waitgroup
func (e *Exporter) scrape(ch chan <- prometheus.Metric) {
   var (
      wg sync.WaitGroup
      err error
   )

   defer wg.Wait()
   for _,scraper := range  e.scrapers {
      wg.Add(1)
      //使用匿名函数 并且并发的收集指标
      go func(scraper Scraper) {
         defer wg.Done()
         label := scraper.Name()
         err = scraper.Scrape(ch)
         if err != nil {
            log.WithField("scraper", scraper.Name()).Error(err)
            e.metrics.ScrapeErrors.WithLabelValues(label).Inc()
            e.metrics.Error.Set(1)
         }
      }(scraper)
   }
}

Exporter.go中主要是通过New 以及NewMetrics 初始化exporter结构体以及Metrics 结构体 exporter结构体需要满足Describe 和Collect 方法

(4)scraper.go

package collector

import "github.com/prometheus/client_golang/prometheus"

type Scraper interface {
   // Name of the Scraper. Should be unique.
   Name() string

   // Help describes the role of the Scraper.
   // Example: "Collect from SHOW ENGINE INNODB STATUS"
   //Help() string

   // Scrape collects data from client and sends it over channel as prometheus metric.
   Scrape(ch chan<- prometheus.Metric) error
}

所有指标收集需要满足2个方法 name返回指标名字来用于用户开关指标的 可以理解为所有指标都必须满足这个约定

等同于我们一个接口切片,将结构体赋值给接口 但是结构体需要满足接口的方法,然后range 并调用接口的Scrape 来采集指标

go的接口继承类似于鸭子 接口定义了鸭子长什么样子也就是需要实现的方法,那么我们实现了这些方法的结构体就是一只鸭子 然后map中的k是一个接口 我们赋予的是一个结构体 结构体实现了接口的方法, 那么我们就可以吧结构体赋值给接口
在这里插入图片描述

(5)cpu.go

package collector

import (
   "github.com/prometheus/client_golang/prometheus"
   "github.com/shirou/gopsutil/load"
   "log"
)

type CpuLoad struct {}

// cpu info

func (CpuLoad) Name() string {
   return namespace + "_cpu_load"
}

func (CpuLoad) Scrape(ch chan <- prometheus.Metric) error  {
   hostinfo := GetHost()
   cpuload,err  := load.Avg()
   if err != nil {
      log.Printf("cpu load is not ,%v\n",err)
      return err
   }

   ch <- prometheus.MustNewConstMetric(
      //这里的label是固定标签 我们可以通过
      NewDesc("cpu_load","one","cpu load",[]string{"type"},prometheus.Labels{"host":hostinfo.HostName,"ip":hostinfo.IP}),
      prometheus.GaugeValue,
      cpuload.Load1,
      //动态标签的值 可以有多个动态标签
      "metrics",
   )
   ch <- prometheus.MustNewConstMetric(
      NewDesc("cpu_load","five","cpu load",nil,nil),
      prometheus.GaugeValue,
      cpuload.Load5,
   )
   ch <- prometheus.MustNewConstMetric(
      NewDesc("cpu_load","fifteen","cpu load",nil,nil),
      prometheus.GaugeValue,
      cpuload.Load15,
   )
   return nil
}

这个就相对简单。我们只需使用之前定义的函数方法。满足name以及Scrape 接口即可 然后通过chan <- prometheus.Metric只写管道来写入我们需要的指标,这里需要注意的是我们之前提到的4中prometheus指标类型有一些在这里需要float64的值传入 但是我们收集到的并不一定都是float64类型的那么我们在做类型转换的过程中需要考虑大转小溢出的问题

三、运行exporter

到这里我们的exporter就开发完成了 让我们编译跑起来看一看 我这里是mac环境如果编译linux 可以百度一下mac编译linux

CGO_ENABLED=0 GOOS=linux GOARCH=amd64 go build  .

这个是mac环境编译linux可执行程序

如果你在linux系统那么你可以直接build

如何安装go以及配置go proxy 可以百度一下这里使用的是1.14的go

nohup ./myexporter &> 1.txt &

在这里插入图片描述

prometheus添加我们的exporter地址

在这里插入图片描述
在这里插入图片描述

当然如果需要docker image 也可以自己制作一个dockerfile

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章