ElasticSearch學習筆記(二)——對聚合的簡單理解

原創

2020-06-09 18:56

測試數據請看上一篇博客“筆記(一)”

聚合的格式一般爲

{
	"aggs":{
		"my_agg_name":{
			...
		}
	}
}

1.若是

{
	"aggs":{
		"my_agg_name":{
			"terms":{
				"field":"city"
			}
		}
	}
}

相當於

SELECT city,COUNT(*) FROM table GROUP BY city; #分組聚合，會返回buckets

2.若是

{
	"aggs":{
		"my_agg_name":{
			"avg":{
				"field":"money"
			}
		}
	}
}

相當於

SELECT AVG(money) FROM table; #度量聚合，會返回一個value

3.若是

{
	"aggs":{
		"my_agg_name":{
			"terms":{
				"field":"city"
			},
			"aggs":{
				"my_child_agg_name":{
					"avg":{
						"field":"money"
					}
				}
			}
		}
	}
}

相當於

SELECT city,AVG(money) FROM table GROUP BY city; #分組聚合，會返回buckets，每個bucket裏有一個度量聚合

對比1和3，
SELECT city,COUNT(*) FROM table GROUP BY city; #分組聚合，會返回buckets
SELECT city,AVG(money) FROM table GROUP BY city; #分組聚合，會返回buckets，每個bucket裏有一個度量聚合
SQL語句差不多，一個是統計每組記錄數，一個是統計每組錢的平均值，

但1只用了一次聚合，3在聚合裏用了一個子聚合

4.重點，並列的子聚合！

{
	"aggs":{
		"my_agg_name":{
			"terms":{
				"field":"city"
			},
			"aggs":{
				"my_child_agg_name":{
					"avg":{
						"field":"money"
					}
				},
				"my_child_agg_name2":{
					"max":{
						"field":"money"
					}
				}
			}
			
		}
	}
}

相當於

SELECT city,AVG(money),MAX(money) FROM table GROUP BY city; #分組聚合，會返回buckets

結論：並列的子聚合之間其實沒有一點關係，都是對上一級的結果進行再操作。

再舉個例子：

{
	"aggs":{
		"my_agg_name":{
			"filter":{  //過濾，查找所有
				"query": {
					"match_all": {}
				}
			},
			"aggs":{
				"name1_0":{  //並列的子聚合互不影響，對上一級的結果進行操作，按age分組，包含key是15和2的桶（只有15的桶）
					"terms":{
						"field":"age",
						"include":[15,2]
					}
				},
				"name1_4":{  //並列的子聚合互不影響，對上一級的結果進行操作，先過濾出年齡是15的，再按money分組（得到5個桶）
					"filter":{
						"query": {
							"term": {
								"age": 15
							}
						}
					},
					"aggs":{
						"name1_4_0":{
							"terms":{
								"field":"money"
							}
						}
					}
				},
				"name1_5":{  //並列的子聚合互不影響，對上一級的結果進行操作，先過濾出錢是4000的，再按age分組（得到1個桶）
					"filter":{
						"query": {
							"term": {
								"money": 4000
							}
						}
					},
					"aggs":{
						"name1_5_0":{
							"terms":{
								"field":"age"
							}
						}
					}
				}
			}
		}
	}
}

可以在筆記(一)插入的數據中跑跑上述代碼，加深理解。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

ElasticSearch學習筆記(二)——對聚合的簡單理解

高效率使用windows

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

ElasticSearch學習筆記(二)——對聚合的簡單理解

劍指offer解答（第一部分）

樸素貝葉斯寫詩機器人

python快速排序

如何從零開始寫一個即時通訊軟件（附源碼）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結