如何查詢表中重複數據

原創

2020-02-21 07:12

建立以table，表名爲Test_Table，設置字段分別爲ID（自增），A，B,C,D,E，然後向裏分別插入如下數據：

1，1，1，1，1

1，1，1，1，1

2，2，2，2，2

3，3，3，3，3

4，4，4，4，4

4，4，4，4，4

5，5，5，5，5

5，5，5，5，5
6，6，6，6，6

7，7，7，7，7

如查找重複的數據，則SQL語句如下：

select P.* from Test_Table as P inner join
(SELECT A,B,C,D,E FROM Test_Table
GROUP BY A,B,C,D,E HAVING COUNT(*)>1) as Q
on P.A=Q.A AND P.B=Q.B AND P.C=Q.C AND P.D=Q.D
AND P.E=Q.E，結果如下：

ID A B C D E

1 1 1 1 1 1

2 1 1 1 1 1

5 4 4 4 4 4

6 4 4 4 4 4

7 5 5 5 5 5

8 5 5 5 5 5

如查找查找ID最大的重複記錄，代碼如下：

select P.* from Test_Table as P inner join
(SELECT A,B,C,D,E FROM Test_Table
GROUP BY A,B,C,D,E HAVING COUNT(*)>1) as Q
on P.A=Q.A AND P.B=Q.B AND P.C=Q.C AND P.D=Q.D
AND P.E=Q.E
WHERE P.ID NOT IN (SELECT MIN(ID) FROM Test_Table
GROUP BY A,B,C,D,E HAVING COUNT(*)>1)

結果如下所示：

ID A B C D E

2 1 1 1 1 1

6 4 4 4 4 4

8 5 5 5 5 5

若刪除重複記錄中ID值最大的數據，則代碼如下：

delete from Test_Table where ID IN (
select P.ID from Test_Table as P inner join
(SELECT A,B,C,D,E FROM Test_Table
GROUP BY A,B,C,D,E HAVING COUNT(*)>1) as Q
on P.A=Q.A AND P.B=Q.B AND P.C=Q.C AND P.D=Q.D
AND P.E=Q.E
WHERE P.ID NOT IN (SELECT MIN(ID) FROM Test_Table
GROUP BY A,B,C,D,E HAVING COUNT(*)>1))

當然，以上代碼只是針對表中數據比較少而言，如數據表中存儲有百萬條以上數據，如刪除其中的重複數據，建議還是需要加入臨時表進行處理。

發佈了3 篇原創文章 · 獲贊 0 · 訪問量 2萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

性能優化（七）-MySQL篇

一、目錄理論基礎優化實踐常見坑二、基礎知識 2.1 Mysql explain使用 2.2 聚合索引和非聚合索引 MySQL索引可以分爲兩類：聚合索引和非聚合索引，其中聚合索引也被稱爲一級索引，非聚合索引也被稱爲輔助索引、二級索

2024-03-20 12:59:21

vxe-table的合併行以及同一行的合併列

vxe-table 是一款優秀的前段插件,可以採用雙向綁定快速的顯示錶格內容,頁面元素使用即時插入的方式,讓頁面更順滑 ,今天來討論一下vxe-table的合併行以及同一行的合併列合併需要使用的屬性是 : span-met

2024-04-19 00:53:28

詳解數倉的向量化執行引擎

本文分享自華爲雲社區《GaussDB(DWS)向量化執行引擎詳解》，作者： yd_212508532。前言適用版本：【基線功能】傳統的行執行引擎大多采用一次一元組的執行模式，這樣在執行過程中CPU大部分時間並沒有用來處理數據，更

2024-04-25 10:33:17

一次奇妙的任意用戶登錄實戰

剛剛進行了微信sessionkey的學習，正準備實戰一下，就發現了這個神奇的網站，預知後事如何。請繼續向下看去 1. 目標 2. 開局一個登錄框 3. 首先，直接弱口令走起來，萬一留有測試的賬號呢嘗試，1311111111，1333

2024-04-22 22:46:11

MaxCompute 近實時增全量處理一體化新架構和使用場景介紹

隨着當前數據處理業務場景日趨複雜，對於大數據處理平臺基礎架構的能力要求也越來越高，既要求數據湖的大存儲能力，也要求具備海量數據高效批處理能力，同時還可能對延時敏感的近實時鏈路有強需求，本文主要介紹基於 MaxCompute 的離線近實時一體

2024-04-15 23:41:52

vue3 清空reactive的多種方式精選原創

在 Vue3 中，可以使用 reactive 函數創建響應式對象。這些響應式對象可以跟蹤其屬性的變化並且自動地更新視圖。但是在某些情況下，我們可能需要清空這些響應式對象。下面是一些方法來清空 Vue3 reactive。方法一：使用 Ob

2024-04-12 00:51:32

大量數據如何做分頁處理

本文分享自華爲雲社區《應用中大量數據的分頁處理》，作者：碼樂。簡介大批量數據的展示一直被視爲一個必須要解決的問題。一個經典的思想就是分批展示和處理它們。 1 查詢時外鍵的處理如果在django model 中模型使用了外鍵，通過

2024-04-10 10:33:03

MySQL 主從 AUTO_INCREMENT 不一致問題分析

作者：vivo 互聯網數據庫團隊 - Wei Haodong 本文介紹了 MySQL5.7 中常見的replace into 操作造成的主從auto_increment不一致現象，一旦觸發了主從切換，業務的正常插入

2024-04-07 11:24:46

kube-apiserver限流機制原理

本文分享自華爲雲社區《kube-apiserver限流機制原理》，作者：可以交個朋友。背景 apiserver是kubernetes中最重要的組件，一旦遇到惡意刷接口或請求量超過承載範圍，apiserver服務可能會崩潰，導致整個kub

2024-04-07 10:32:03

TiDB MVCC 版本堆積相關原理及排查手段

導讀本文介紹了 TiDB 中 MVCC（多版本併發控制）機制的原理和相關排查手段。 TiDB 使用 MVCC 機制實現事務，在寫入新數據時不會直接替換舊數據，而是保留舊數據的同時以時間戳區分版本。當歷史版本堆積過多時，會導致讀寫性能下降

2024-04-07 10:23:10

TiDB 組件 GC 原理及常見問題

導讀本文詳細介紹了 TiDB 的 Garbage Collection（GC）機制及其在 TiDB 組件中的實現原理和常見問題排查方法。 TiDB 底層使用單機存儲引擎 RocksDB，並通過 MVCC 機制，基於 RocksDB 實現了

2024-04-07 10:23:05

TiDB 社區智慧合集丨解碼 TiDB 性能謎題：讓你的數據庫發揮最強動力!

來自社區，迴歸社區。非常感謝各位 TiDBer 在之前【TiDBer 嘮嗑茶話會丨徵集 TiDB 數據庫性能優化大師，你是如何優化 TiDB 數據庫性能的吶？】( https://asktug.com/t/topic/1005563

2024-04-05 22:23:12

40 個 SpringBoot 常用註解

目錄一、Spring Web MVC 與 Spring Bean 註解二、Spring Bean 註解三、Spring Dependency Inject 與 Bean Scops註解四、容器配置註解五、Spr

2024-04-01 22:49:58

快速掌握 MySQL 授權表運維注意事項

普通用戶有MySQL鑑權表的訪問權限帶來的風險。作者：餘振興，愛可生 DBA 團隊成員，熱衷技術分享、編寫技術文檔。愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。本文共 1100 字，預計閱讀需要 3

2024-03-20 12:05:55

詳解GaussDB(DWS)中3個防過載檢查項

本文分享自華爲雲社區《【防過載檢查項】》，作者：譡裏個檔。 1. GUC參數檢查目的：針對不同版本建議設定不同的參數值，當前先檢查出來，後續diagnosis會給出建議值 SELECT split_part((substri

2024-03-18 23:17:14

24小時熱門文章

最新文章

最新評論文章