Elasticsearch核心技术与实战学习笔记 第三章 22Elasticsearch聚合分析简介

一 序

  本文属于极客时间Elasticsearch核心技术与实战学习笔记系列。

本节课简单介绍ES聚合分析。

二 聚合(Aggregation)

Kibana 可视化报表 就是基于 Aggregation实现。

集合的分类

  • Bucket Aggregation - 一些列满足特定条件的文档的集合
  • Metric Aggregation - 一些数学运算,可以对文档字段进行统计分析
  • Pipeline Aggregation - 对其他的聚合结果进行二次聚合
  • Matrix Aggregation - 支持对多个字段的操作并提供一个结果矩阵

metric bucket

  • Metric - 一些系统的统计方法(类似 count)
  • Bucket - 一组满足条件的文档(group by) 

Bucket

一些例子

  • 杭州属于浙江 / 演员是男或女
  • 嵌套关系 - 杭州属于浙江属于中国属于亚洲

ES 提供了许多的类型的 Bucket,帮助用多种方式划分文档

  • Tern & Range (时间 / 年龄区间 / 地理位置)

 metric

  • Metric 会基于数据集计算结果,除了支持在字段上进行计算,同样也支持在脚本(painless script)产生的结果之上进行计算
  • 大多数 Metric 是数学计算,仅输出一个值
    • min / max / sum / avg /cardinality
  • 部分 metric 支持输出多个数值
    • stats / percentiles / percentile_ranks

 

demo

航班目的地份桶统计

查看航班目的地的统计信息,增加平均,最高最低价格 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章