Apache Druid 0.18.1使用準確值去重方式

原創

2020-06-07 23:04

簡述

Apache druid 中的 COUNT(DISTINCT expr) 默認是使用近似值算法HyperLogLog.
原來介紹過druid本身是爲了海量數據分析而設計，所以在大數據量的情況下，使用近似值算法，速度更快。但有的需求，數據量本身較小，對數據的精準性要求比較高。不希望使用近似值的方式。

取消近似值的方式

連接時設置 `useApproximateCountDistinct`

useApproximateCountDistinct 默認值是true,設置false後，將使用精準值計算。

 String url = "jdbc:avatica:remote:url=http://" + "ip:8082"
                         + "/druid/v2/sql/avatica/";

            Properties connectionProperties = new Properties();
             connectionProperties.setProperty("useApproximateCountDistinct","false"）
         
            Connection connection = DriverManager.getConnection(url, connectionProperties);

broker 配置

druid.sql.planner.useApproximateCountDistinct=false

總結

根據自己的需求場景設置，一般建議在連接時使用，更加靈活些。在broker加入配置後，所有的近似值都將無法生效。也將會影響查詢性能。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

TOP SQL監控之MySQL篇

MySQL的監控方式也有很多種：慢查詢日誌slow_log 優點：MySQL自帶，記錄的慢SQL語句完整；缺點：需要登錄mysql服務器；如果slow_log文件太大，還需要利用其他工具分析日誌，比如mysqldumpslow； p

2024-05-14 01:47:36

JDBC連接openGauss6.0和PostgreSQL16.2性能對比

本文分享自華爲雲社區《JDBC連接openGauss6.0和PostgreSQL16.2性能對比》，作者： Gauss松鼠會小助手。 PostgreSQL vs openGauss 01 前置準備安裝JDK：詳細安裝步驟請問度娘，輸

2024-05-14 11:00:08

爲什麼阿里不建議用excutors創建線程池

1 前言：大家都知道，阿里規範中有一條是不允許用excutors去創建線程池，而是採用ThreadPoolExecutor的原生方式去創建。很早就聽過所過這種說法，但是一直都沒去搞清楚是爲什麼，今天就查閱資料去了解了這

2024-05-14 02:07:06

Java遊戲服務器3

1)編碼消息長度(short int-->2個字節) + 消息編號(short int--》2個字節) + 消息體 2)Protobuf協議文檔 (1)syntax="proto3"; (2)命名格式

2024-05-14 02:04:28

Android內存管理機制官方詳解文檔

很早之前寫過一篇《Android內存管理機制詳解》點擊量已7萬+，現把Google官方文檔整理輸出一下，供各位參考。一、內存管理概覽 Android 運行時 (ART) 和 Dalvik 虛擬機使用分頁和內存映射來管理內存。這意味着應用

2024-05-14 00:37:42

OSS_PIPE：Rust編寫的大規模文件遷移工具| 京東雲技術團隊

文盤rust 好久沒有更新了。這段時間筆者用rust寫了個小東西，跟各位分享一下背景隨着業務的發展，文件數量和文件大小會急劇增加，文件遷移的數量和難度不斷攀升。oss_pipe 是rust編寫的文件遷移工具，旨在支撐大規模的文件遷移場

2024-05-13 23:59:27

面試官：說說你對序列化的理解

本文主要內容背景在Java語言中，程序運行的時候，會產生很多對象，而對象信息也只是在程序運行的時候纔在內存中保持其狀態，一旦程序停止，內存釋放，對象也就不存在了。怎麼能讓對象永久的保存下來呢？--------對象序列化。何

2024-05-13 22:58:28

JAVA基礎之常用類（一）String

綱要 String StringBuffer 基礎類型對應的8個包裝類日期相關類數字相關類 Random Enum 1. 理解String類的存儲原理 String類是不可變類，也就是說String對象聲明後，將不可修改。 S

2024-05-13 22:07:29

消費者太多！RocketMQ又炸了！

去年寫過一篇《Topic數量太多！RocketMQ炸了！》，大家評價還不錯。結果，2024年的開頭，我們的RocketMQ又炸了！ 1、問題現象先說明下RocketMQ版本， 4.6.0的老版本了。線下環境客戶端啓動會頻

2024-05-13 12:34:50

從XML配置角度理解Spring AOP

本文分享自華爲雲社區《Spring高手之路18——從XML配置角度理解Spring AOP》，作者：磚業洋__。 1. Spring AOP與動態代理 1.1 Spring AOP和動態代理的關係 Spring AOP使用動態代理作爲

2024-05-13 11:31:09

有點意思的 Java 遞歸調用

最近在刷一些問題的時候看到有下面一個問題上面問的是當輸入的字符串爲什麼的時候返回 True 總結在做題目的時候，第一次還做錯了。這是因爲解答這個題目的時間只有 3 分鐘，沒有自己看題目後來拿着程序跑了下。 p

2024-05-13 02:41:48

Spring Boot3，啓動時間縮短 10 倍！

前面松哥寫了一篇文章和大家聊了 Spring6 中引入的新玩意 AOT（見Spring Boot3 新玩法，AOT 優化！）。文章發出來之後，有小夥伴問松哥有沒有做性能比較，老實說，這個給落下了，所以今天再來一篇文章，和小夥伴們梳理比較小

2024-05-13 02:20:47

企業IT架構治理之道

一、什麼是架構和治理 1.1 架構的起源開篇還是要說說大家理解的架構，何爲架構，架構跟我們的工作和生活有什麼關係。英文Architecture本源來自於拉丁語，最早起源於建築領域，建築是文明社會一個重要的標誌，同時也是人類社會最早

京東雲開發者

2024-05-13 23:59:32

內嵌專業接口的RISC-V架構MCU，誰家有？

前一陣，蘋果推出了M1處理器，相比關注具體指標，業內其實更關心M1推出後會引領產業往哪個方向發展，不少人的結論是RISC-V會成爲未來芯片發展的熱點，因爲RISC-V有很多巧妙的方法可以提高性能。計算機界泰斗David Patterso

2024-05-13 23:26:39

免費報名|Zabbix受邀出席上海開源技術沙龍，探討開源軟件賦能新質生產力

大家好！5月25日我們將舉辦今年第三期上海開源技術沙龍活動。本次的主題是——開源軟件賦能新質生產力。在上海開源信息技術協會 (SHOpen) 的指導下，隨着活動的持續開展，上海開源技術沙龍獲得了越來越多開發者的關注與

2024-05-13 22:34:43

24小時熱門文章

最新文章

最新評論文章