infobright distinct 内存被爆掉

原創

2019-02-23 00:31

INFOBRIGHT 引擎下的DISTINCT的内存爆：

ERROR 9 (HY000): Brighthouse out of resources error: Insufficient memory/disk space

mysql> SELECT count( uuid) as vnum FROM visit_info WHERE (1=1) and usertype in (-1) and (begintime >= 1380556800 and begintime <= 1387209600);
+----------+
| vnum |
+----------+
| 37196097 |
+----------+
1 row in set (2.82 sec)

Distinct实现原理：

在数据库的设计中，如何实现Distinct操作呢？一般有两种基本思路：排序（Sort）法，哈希（Hash）法。

排序法将表格中的数据全部按照distinct指定的列为key进行排序，然后逐行迭代，
每迭代出一行数据都与上一行数据根据key作对比，如果相同，则丢弃当前行继续迭代下一行，
如果不同则输出。排序法带来的一个副作用就是数据输出按照key有序。

哈希法将表格中的数据全部按照distinct指定的列值为key作为hash key进行分桶，key相同的行自然就被区分出来了。

排序法在具体实现中会遇到这么一些问题：

1. 数据集超出了内存限制，如何排序？

2. 如何实现可以尽可能减少数据拷贝？

3. 如果已经有了Sort运算符，如何实现代码重用。

问题：上面两种方法在内存占用上那个更省？

最后说个题外话，distinct跟groupby蛮像的，那么他们的区别又在哪里呢？简单地说，distinct是一种很弱的groupby。详细见网上转载的一篇文章：

参考博客：

http://blog.csdn.net/maray/article/details/7634543

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

infobright distinct 内存被爆掉

MySQL 核心模块揭秘 | 18 期 | 锁在内存里长什么样*

使用perf工具生成火焰图

HttpSecurity 是如何组装过滤器链的

数说海南——近6年海南各市县人口简单看

长序列中Transformers的高级注意力机制总结

WebStorm 创建 Vue 项目

大龄程序员思考

响应式界面控件DevExtreme * 更强的数据分析和可视化功能

修改Ubuntu 或者kubuntu 終端bash顯示路徑信息的方法

關於MongoDB你需要知道的幾件事

Ubuntu13.04 resolv.conf 總是被清除-網上很多轉摘的方法沒法用

關於mysql 刪除數據後物理空間未釋放(轉載)

kubuntu13 安裝無法進入桌面系統

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結