Elasticsearch核心技術與實戰學習筆記 第三章 22Elasticsearch聚合分析簡介

一 序

  本文屬於極客時間Elasticsearch核心技術與實戰學習筆記系列。

本節課簡單介紹ES聚合分析。

二 聚合(Aggregation)

Kibana 可視化報表 就是基於 Aggregation實現。

集合的分類

  • Bucket Aggregation - 一些列滿足特定條件的文檔的集合
  • Metric Aggregation - 一些數學運算,可以對文檔字段進行統計分析
  • Pipeline Aggregation - 對其他的聚合結果進行二次聚合
  • Matrix Aggregation - 支持對多個字段的操作並提供一個結果矩陣

metric bucket

  • Metric - 一些系統的統計方法(類似 count)
  • Bucket - 一組滿足條件的文檔(group by) 

Bucket

一些例子

  • 杭州屬於浙江 / 演員是男或女
  • 嵌套關係 - 杭州屬於浙江屬於中國屬於亞洲

ES 提供了許多的類型的 Bucket,幫助用多種方式劃分文檔

  • Tern & Range (時間 / 年齡區間 / 地理位置)

 metric

  • Metric 會基於數據集計算結果,除了支持在字段上進行計算,同樣也支持在腳本(painless script)產生的結果之上進行計算
  • 大多數 Metric 是數學計算,僅輸出一個值
    • min / max / sum / avg /cardinality
  • 部分 metric 支持輸出多個數值
    • stats / percentiles / percentile_ranks

 

demo

航班目的地份桶統計

查看航班目的地的統計信息,增加平均,最高最低價格 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章