MySQL --- 處理重複數據筆記

防止表中出現重複數據

你可以在MySQL數據表中設置指定的字段爲 PRIMARY KEY(主鍵) 或者 UNIQUE(唯一) 索引來保證數據的唯一性。

例子如下,下表中無索引及主鍵,所以該表允許出現多條重複記錄。

CREATE TABLE person_tbl
(
    first_name CHAR(20),
    last_name CHAR(20),
    sex CHAR(10)
);

如果你想設置表中字段first_name,last_name數據不能重複,你可以設置雙主鍵模式來設置數據的唯一性, 如果你設置了雙主鍵,那麼那個鍵的默認值不能爲NULL,可設置爲NOT NULL。如下所示:

CREATE TABLE person_tbl
(
   first_name CHAR(20) NOT NULL,
   last_name CHAR(20) NOT NULL,
   sex CHAR(10),
   PRIMARY KEY (last_name, first_name)
);

另一種設置數據的唯一性方法是添加一個UNIQUE索引,如下所示:

CREATE TABLE person_tbl
(
   first_name CHAR(20) NOT NULL,
   last_name CHAR(20) NOT NULL,
   sex CHAR(10)
   UNIQUE (last_name, first_name)
);

總結:
如果想要數據不重複,
1.設置該字段爲主鍵來確保數據的唯一性,且這個字段默認值不能爲NULL,可設置爲NOT NULL
2.也可以設置UNIQUE索引

統計重複數據

以下我們將統計表中 first_name 和 last_name的重複記錄數:

mysql> SELECT COUNT(*) as repetitions, last_name, first_name
    -> FROM person_tbl
    -> GROUP BY last_name, first_name
    -> HAVING repetitions > 1;

以上查詢語句將返回 person_tbl 表中重複的記錄數。 一般情況下,查詢重複的值,請執行以下操作:

  • 確定哪一列包含的值可能會重複。
  • 在列選擇列表使用COUNT(*)列出的那些列。
  • 在GROUP BY子句中列出的列。
  • HAVING子句設置重複數大於1。

例子:

mysql> select count(*) as repetitions, devId from singleasset group by devId having repetitions > 1;

輸出:

+-------------+----------+
| repetitions | devId    |
+-------------+----------+
|           3 | 30000001 |
|          12 | 30000002 |
+-------------+----------+
2 rows in set (0.00 sec)

過濾重複數據

如果你需要讀取不重複的數據可以在 SELECT 語句中使用 DISTINCT 關鍵字來過濾重複數據。

mysql> SELECT DISTINCT last_name, first_name
    -> FROM person_tbl;

你也可以使用 GROUP BY 來讀取數據表中不重複的數據:

mysql> SELECT last_name, first_name
    -> FROM person_tbl
    -> GROUP BY (last_name, first_name);

例子:

mysql> select distinct devId from singleasset;

或

mysql> select devId from singleasset group by devId;

輸出:

+----------+
| devId    |
+----------+
| 30000001 |
| 30000002 |
+----------+
發佈了102 篇原創文章 · 獲贊 26 · 訪問量 15萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章