一 序
本文屬於極客時間Elasticsearch核心技術與實戰學習筆記系列。
本節課簡單介紹ES聚合分析。
二 聚合(Aggregation)
Kibana 可視化報表 就是基於 Aggregation實現。
集合的分類
- Bucket Aggregation - 一些列滿足特定條件的文檔的集合
- Metric Aggregation - 一些數學運算,可以對文檔字段進行統計分析
- Pipeline Aggregation - 對其他的聚合結果進行二次聚合
- Matrix Aggregation - 支持對多個字段的操作並提供一個結果矩陣
metric bucket
- Metric - 一些系統的統計方法(類似 count)
- Bucket - 一組滿足條件的文檔(group by)
Bucket
一些例子
- 杭州屬於浙江 / 演員是男或女
- 嵌套關係 - 杭州屬於浙江屬於中國屬於亞洲
ES 提供了許多的類型的 Bucket,幫助用多種方式劃分文檔
- Tern & Range (時間 / 年齡區間 / 地理位置)
metric
- Metric 會基於數據集計算結果,除了支持在字段上進行計算,同樣也支持在腳本(painless script)產生的結果之上進行計算
- 大多數 Metric 是數學計算,僅輸出一個值
- min / max / sum / avg /cardinality
- 部分 metric 支持輸出多個數值
- stats / percentiles / percentile_ranks
demo
航班目的地份桶統計
查看航班目的地的統計信息,增加平均,最高最低價格