使用count(1)確認presto、SQL、HIVE查詢沒有重複數據

原創

2020-06-16 15:30

例如我們錨定student_id

select count(1),
count(distinct student_id) ----注意distinct 的重要使用
from
abc.table_student;

不一致那麼就有重複值，會出現一對多，一個id多條信息

或者：
select student_id,count(1) from abc.table_student
group by student_id
having count(1)>=2;

count(1)的作用，就是統計在分組中，每一組對應的行數或項數。效率和作用和count(*)相同。
Count（）中的表達式是否爲NULL，如果爲NULL則不計數，而非NULL則會計數。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

入職3年-我如何做一名AI產品經理

引言從2021年校招加入京東開始，我一直從事AI產品經理的工作，有幸見證了AI行業的熱情從一臺臺服務器燒到了全世界各個角落，也見證了京東AI中臺團隊的影響力如何一步步的擴大。從21年的迷茫到24年的堅定，很慶幸我正走在適合自己的道路上，

2024-04-22 11:16:31

Java HotSpot(TM) 64-Bit Server VM warning: Can't have more ConcGCThreads (16)

啓動presto服務錯誤： Java HotSpot(TM) 64-Bit Server VM warning: Can't have more ConcGCThreads (16) than ParallelGCThreads (13).

2024-03-20 22:15:25

數據湖三大框架

一、數據湖框架目前市面上流行的三大開源數據湖方案分別爲：Delta Lake、Apache Iceberg和Apache Hudi 1、Delta Lake：DataBricks公司推出的一種數據湖方案，官網 2、Apache Iceb

2024-03-14 00:16:55

開源大數據平臺 E-MapReduce Serverless StarRocks 產品介紹

摘要：本文將分享阿里雲與 StarRocks 社區合作打造的雲上 StarRocks 極速湖倉的雲原生產品實踐。主要包括四個部分，第一部分介紹 StarRocks 全託管形態，以及免運維服務的 OLAP 雲產品；第二部分介紹 Star

2023-06-06 00:24:27

數據測試實踐：從一個bug開始的大數據引擎兼容性探索

作者：京東零售李曉潔我們常常忘記，天才也取決於其所能掌握的數據，即使阿基米德也無法設計出愛迪生的發明。——Ernest Dimnet 在大數據時代，精準而有效的數據對於每個致力於長期發展的組織來說都是重要資產之一，而數據測試更是不

2023-03-07 11:35:22

BeetlSQL 是如何支持多庫的

BeetlSQL目標是代替傳統的Hibernate，JPA，MyBatis。傳統數據庫：MySQL,MariaDB,Oralce,Postgres,DB2,SQL Server，H2,SQLite,Derby，神通，達夢，華爲高斯

2022-04-30 06:25:41

全票通過！微衆開源項目Linkis進入Apache孵化

8月2日，微衆銀行開源項目Linkis 正式通過國際頂級開源組織 Apache 軟件基金會（簡稱 ASF ）的投票決議，以全票通過的優秀表現成爲 ASF孵化器項目。 Linkis 是微衆銀行第二個進入 ASF 的項目，自此微

2021-12-25 21:49:16

什麼是OLAP？主流八大開源OLAP技術架構對比

隨着大數據技術在各行各業的深入應用，對於海量數據的分析需求也愈加凸顯，OLAP技術也逐漸走入人們的視野。本文將圍繞常見的開源OLAP引擎展開，介紹什麼是OLAP以及OLAP的常見操作和分類，並對目前主流的開源OLAP引擎進行對比和特點的總結

2021-12-25 21:30:41

可視化實時報表背後的痛點，OLTP + OLAP最佳方案是什麼，HTAP？

1、集大成者HTAP HTAP = OLTP + OLAP tidb、hologres、oceanbase 2、OLTP事務型代表 oracle、mysql 3、OLAP數據分析查詢，MPP能力代表 presto、driud

2021-12-25 21:22:47

Alluxio - 爲機器學習和統計分析而生的數據編排工具

今天給大家分享一款數據編排工具，名字叫做Alluxio，不知道大家有沒有聽過？說句實話，我還是第一次聽說有這款軟件存在，雖然這款軟件，早在2014年，就有人在開源中國中提交了。 Alluxio基於Apache License 2.0開源

2021-12-25 21:16:44

Oracle 大佬離職，怒噴 MySQL “糟糕的數據庫”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 19:58:57

支撐 40億數據總量、分鐘級報表：中通大數據平臺在大促中的進化

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-21 20:13:57

全網播放超 5億的秒級實時臺網互動是如何實現的？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-15 15:03:49

30天完成數據庫替換、頂住10倍大促流量壓力，易車是如何做到的？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-10 14:08:50

突破極限，京東雲數據庫打造急速秒殺體驗

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-08 15:18:58

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章