使用count(1)确认presto、SQL、HIVE查询没有重复数据

原創

2020-06-16 15:30

例如我们锚定student_id

select count(1),
count(distinct student_id) ----注意distinct 的重要使用
from
abc.table_student;

不一致那么就有重复值，会出现一对多，一个id多条信息

或者：
select student_id,count(1) from abc.table_student
group by student_id
having count(1)>=2;

count(1)的作用，就是统计在分组中，每一组对应的行数或项数。效率和作用和count(*)相同。
Count（）中的表达式是否为NULL，如果为NULL则不计数，而非NULL则会计数。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

入职3年-我如何做一名AI产品经理

引言從2021年校招加入京東開始，我一直從事AI產品經理的工作，有幸見證了AI行業的熱情從一臺臺服務器燒到了全世界各個角落，也見證了京東AI中臺團隊的影響力如何一步步的擴大。從21年的迷茫到24年的堅定，很慶幸我正走在適合自己的道路上，

2024-04-22 11:16:31

Java HotSpot(TM) 64-Bit Server VM warning: Can't have more ConcGCThreads (16)

啓動presto服務錯誤： Java HotSpot(TM) 64-Bit Server VM warning: Can't have more ConcGCThreads (16) than ParallelGCThreads (13).

2024-03-20 22:15:25

数据湖三大框架

一、數據湖框架目前市面上流行的三大開源數據湖方案分別爲：Delta Lake、Apache Iceberg和Apache Hudi 1、Delta Lake：DataBricks公司推出的一種數據湖方案，官網 2、Apache Iceb

2024-03-14 00:16:55

开源大数据平台 E-MapReduce Serverless StarRocks 产品介绍

摘要：本文將分享阿里雲與 StarRocks 社區合作打造的雲上 StarRocks 極速湖倉的雲原生產品實踐。主要包括四個部分，第一部分介紹 StarRocks 全託管形態，以及免運維服務的 OLAP 雲產品；第二部分介紹 Star

2023-06-06 00:24:27

数据测试实践：从一个bug开始的大数据引擎兼容性探索

作者：京東零售李曉潔我們常常忘記，天才也取決於其所能掌握的數據，即使阿基米德也無法設計出愛迪生的發明。——Ernest Dimnet 在大數據時代，精準而有效的數據對於每個致力於長期發展的組織來說都是重要資產之一，而數據測試更是不

2023-03-07 11:35:22

BeetlSQL 是如何支持多库的

BeetlSQL目標是代替傳統的Hibernate，JPA，MyBatis。傳統數據庫：MySQL,MariaDB,Oralce,Postgres,DB2,SQL Server，H2,SQLite,Derby，神通，達夢，華爲高斯

2022-04-30 06:25:41

全票通过！微众开源项目Linkis进入Apache孵化

8月2日，微衆銀行開源項目Linkis 正式通過國際頂級開源組織 Apache 軟件基金會（簡稱 ASF ）的投票決議，以全票通過的優秀表現成爲 ASF孵化器項目。 Linkis 是微衆銀行第二個進入 ASF 的項目，自此微

2021-12-25 21:49:16

什么是OLAP？主流八大开源OLAP技术架构对比

隨着大數據技術在各行各業的深入應用，對於海量數據的分析需求也愈加凸顯，OLAP技術也逐漸走入人們的視野。本文將圍繞常見的開源OLAP引擎展開，介紹什麼是OLAP以及OLAP的常見操作和分類，並對目前主流的開源OLAP引擎進行對比和特點的總結

2021-12-25 21:30:41

可视化实时报表背后的痛点，OLTP + OLAP最佳方案是什么，HTAP？

1、集大成者HTAP HTAP = OLTP + OLAP tidb、hologres、oceanbase 2、OLTP事務型代表 oracle、mysql 3、OLAP數據分析查詢，MPP能力代表 presto、driud

2021-12-25 21:22:47

Alluxio - 为机器学习和统计分析而生的数据编排工具

今天給大家分享一款數據編排工具，名字叫做Alluxio，不知道大家有沒有聽過？說句實話，我還是第一次聽說有這款軟件存在，雖然這款軟件，早在2014年，就有人在開源中國中提交了。 Alluxio基於Apache License 2.0開源

2021-12-25 21:16:44

Oracle 大佬离职，怒喷 MySQL “糟糕的数据库”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 19:58:57

支撑 40亿数据总量、分钟级报表：中通大数据平台在大促中的进化

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-21 20:13:57

全网播放超 5亿的秒级实时台网互动是如何实现的？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-15 15:03:49

30天完成数据库替换、顶住10倍大促流量压力，易车是如何做到的？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-10 14:08:50

突破极限，京东云数据库打造急速秒杀体验

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-08 15:18:58

24小時熱門文章

最新文章

最新評論文章