如何在 SQL 中删除重复行？

17 Mar 2025 | 6 分钟阅读

在本节中，我们将学习在 MySQL 和 Oracle 中删除重复行的不同方法。如果 SQL 表包含重复行，则必须删除重复行。

准备示例数据

脚本创建了一个名为 contacts 的表。

DROP TABLE IF EXISTS contacts;
CREATE TABLE contacts (
id INT PRIMARY KEY AUTO_INCREMENT,
first_name VARCHAR(30) NOT NULL,
last_name VARCHAR(25) NOT NULL, 
    email VARCHAR(210) NOT NULL,
    age VARCHAR(22) NOT NULL
);

在上面的表中，我们插入了以下数据。

INSERT INTO contacts (first_name,last_name,email,age) 
VALUES ('Kavin','Peterson','kavin.peterson@verizon.net','21'),
       ('Nick','Jonas','nick.jonas@me.com','18'),
       ('Peter','Heaven','peter.heaven@google.com','23'),
       ('Michal','Jackson','michal.jackson@aol.com','22'),
       ('Sean','Bean','sean.bean@yahoo.com','23'),
       ('Tom ','Baker','tom.baker@aol.com','20'),
       ('Ben','Barnes','ben.barnes@comcast.net','17'),
       ('Mischa ','Barton','mischa.barton@att.net','18'),
       ('Sean','Bean','sean.bean@yahoo.com','16'),
       ('Eliza','Bennett','eliza.bennett@yahoo.com','25'),
       ('Michal','Krane','michal.Krane@me.com','25'),
       ('Peter','Heaven','peter.heaven@google.com','20'),
       ('Brian','Blessed','brian.blessed@yahoo.com','20');
       ('Kavin','Peterson','kavin.peterson@verizon.net','30'),

在执行 DELETE 语句后，我们执行脚本以重新创建测试数据。

查询返回 contacts 表中的数据

SELECT * FROM contacts
ORDER BY email;

id	first_name	last_name	电子邮件	年龄
7	Ben	Barnes	[email protected]	21
13	Brian	Blessed	[email protected]	18
10	Eliza	Bennett	[email protected]	23
1	Kavin	彼得森	[email protected]	22
14	Kavin	彼得森	[email protected]	23
8	Mischa	Barton	[email protected]	20
11	Michal	Krane	[email protected]	17
4	Michal	Jackson	[email protected]	18
2	Nick	Jonas	[email protected]	16
3	彼得	Heaven	[email protected]	25
12	彼得	Heaven	[email protected]	25
5	Sean	Bean	[email protected]	20
9	Sean	Bean	[email protected]	20
6	Tom	Baker	[email protected]	30

以下 SQL 查询从 contacts 表返回重复的电子邮件

SELECT
    email, COUNT(email)
FROM
    contacts
GROUP BY
    email
HAVING
COUNT (email) > 1;

email	COUNT(email)
[email protected]	2
[email protected]	2
[email protected]	2

我们有三行具有重复的电子邮件。

(A) 使用 DELETE JOIN 语句删除重复行

DELETE t1 FROM contacts t1
INNERJOIN contacts t2 
WHERE
    t1.id < t2.id AND
    t1.email = t2.email;

输出

已经删除了三行。我们执行以下查询，以查找表中的 重复电子邮件。

SELECT
    email, 
COUNT (email)
FROM
    contacts
GROUP BY
    email
HAVING
COUNT (email) > 1;

查询返回空集。要验证 contacts 表中的数据，请执行以下 SQL 查询

id	first_name	last_name	电子邮件	年龄
7	Ben	Barnes	[email protected]	21
13	Brian	Blessed	[email protected]	18
10	Eliza	Bennett	[email protected]	23
1	Kavin	彼得森	[email protected]	22
8	Mischa	Barton	[email protected]	20
11	Micha	Krane	[email protected]	17
4	Michal	Jackson	[email protected]	18
2	Nick	Jonas	[email protected]	16
3	彼得	Heaven	[email protected]	25
5	Sean	Bean	[email protected]	20
6	Tom	Baker	[email protected]	30

id 为 9、12 和 14 的行已被删除。我们使用以下语句删除重复行

执行用于创建 contacts 表的脚本。

DELETE c1 FROM contacts c1
INNERJ OIN contacts c2 
WHERE
    c1.id > c2.id AND
    c1.email = c2.email;

id	first_name	last_name	email	年龄
1	Ben	Barnes	[email protected]	21
2	Kavin	彼得森	[email protected]	22
3	Brian	Blessed	[email protected]	18
4	Nick	Jonas	[email protected]	16
5	Michal	Krane	[email protected]	17
6	Eliza	Bennett	[email protected]	23
7	Michal	Jackson	[email protected]	18
8	Sean	Bean	[email protected]	20
9	Mischa	Barton	[email protected]	20
10	彼得	Heaven	[email protected]	25
11	Tom	Baker	[email protected]	30

(B) 使用中间表删除重复行

要使用中间表删除重复行，请按照以下步骤操作：

步骤 1. 创建一个与实际表结构相同的新表

步骤 2. 从原始数据库表中插入不重复的行

INSERT INTO source_copy
SELECT * FROM source
GROUP BY col; 

步骤 3. 删除原始表，并将中间表重命名为原始表名。

DROP TABLE source;
ALTER TABLE source_copy RENAME TO source;

例如，以下语句从 contacts 表中删除具有重复电子邮件的行。

-- step 1
CREATE TABLE contacts_temp
LIKE contacts;

-- step 2
INSERT INTO contacts_temp
SELECT * FROM contacts 
GROUP BY email;

-- step 3
DROP TABLE contacts;

ALTER TABLE contacts_temp
RENAME TO contacts;

(C) 使用 ROW_NUMBER() 函数删除重复行

注意：ROW_NUMBER() 函数自 MySQL 8.02 版本起支持，因此在使用该函数之前，应检查您的 MySQL 版本。

以下语句使用 ROW_NUMBER () 为每行分配一个连续的整数。如果电子邮件重复，则该行的编号将大于一。

SELECT id, email, ROW_NUMBER() 
OVER (PARTITION BY email 
ORDER BY email
	) AS row_num
FROM contacts;

以下 SQL 查询返回重复行的 id 列表

SELECT id
FROM (SELECT id,
ROW_NUMBER() OVER (
PARTITION BY email ORDER BY email) AS row_num
FROM
contacts
) t
WHERE
row_num> 1;

输出

删除 Oracle 中的重复记录

当我们发现表中有重复记录时，我们需要删除不必要的副本，以保持数据的清洁和唯一。如果一个表中有重复行，我们可以使用 DELETE 语句将其删除。

在这种情况下，我们有一个列，它不是用于评估表中重复记录的组的一部分。

考虑下表

VEGETABLE_ID	VEGETABLE_NAME	COLOR
01	Potato	棕色
02	Potato	棕色
03	洋葱	红色
04	洋葱	红色
05	洋葱	红色
06	南瓜	绿色
07	南瓜	黄色

-- create the vegetable table
CREATE TABLE vegetables (
VEGETABLE_ID NUMBER generated BY DEFAULT AS ID ENTITY,
VEGETABLE_NAME VARCHAR2(100),
color VARCHAR2(20),
        PRIMARY KEY (VEGETABLE_ID)
);

-- insert sample rows
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Potato','Brown');
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Potato','Brown');
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Onion','Red');
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Onion','Red');
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Onion','Red');
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Pumpkin','Green');
INSERT INTO vegetables (VEGETABLE_NAME,color) VALUES('Pumpkin','Yellow');

-- query data from the vegetable table
SELECT * FROM vegetables;

假设我们想保留具有最高 VEGETABLE_ID 的行，并删除所有其他副本。

SELECT
MAX (VEGETABLE_ID)
FROM
vegetables
GROUP BY
VEGETABLE_NAME,
color
ORDER BY
MAX(VEGETABLE_ID);

MAX(VEGETABLE_ID)

我们使用 DELETE 语句来删除 VEGETABLE_ID 列 中的值不是最高的行。

DELETE FROM
vegetables
WHERE
VEGETABLE_IDNOTIN
  (
SELECT
MAX(VEGETABLE_ID)
FROM
vegetables
GROUP BY
VEGETABLE_NAME,
color
);

已删除三行。

VEGETABLE_ID	VEGETABLE_NAME	COLOR
02	Potato	棕色
05	洋葱	红色
06	南瓜	绿色
07		黄色

如果想保留 id 最小的行，请使用 MIN() 函数而不是 MAX() 函数。

DELETE FROM
vegetables
WHERE
VEGETABLE_IDNOTIN
  (
SELECT
MIN(VEGETABLE_ID)
FROM
vegetables
GROUP BY
VEGETABLE_NAME,
color
  );

如果存在一个未参与评估重复项的列，则上述方法有效。如果所有列中的值都存在副本，则无法使用 VEGETABLE_ID 列。

让我们删除并用新结构重新创建 vegetable 表。

DROP TABLE vegetables;
CREATE TABLE vegetables (
VEGETABLE_ID NUMBER,
VEGETABLE_NAME VARCHAR2(100),
Color VARCHAR2(20)
);

INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color) VALUES(1,'Potato','Brown');
INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color) VALUES(1, 'Potato','Brown');
INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color)VALUES(2,'Onion','Red');
INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color)VALUES(2,'Onion','Red');
INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color) VALUES(2,'Onion','Red');
INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color) VALUES(3,'Pumpkin','Green');
INSERT INTO vegetables (VEGETABLE_ID,VEGETABLE_NAME,color) VALUES('4,Pumpkin','Yellow');

SELECT * FROM vegetables;

VEGETABLE_ID	VEGETABLE_NAME	COLOR
01	Potato	棕色
01	Potato	棕色
02	洋葱	红色
02	洋葱	红色
02	洋葱	红色
03	南瓜	绿色
04	南瓜	黄色

在 vegetable 表中，VEGETABLE_ID、VEGETABLE_NAME 和 color 列中的值都已复制。

我们可以使用 rowid，它是一个指定 Oracle 存储行的定位器。因为 rowid 是唯一的，所以我们可以使用它来删除重复行。

DELETE
FROM
Vegetables
WHERE
rowed NOT IN
(
SELECT
MIN(rowid)
FROM
vegetables
GROUP BY
VEGETABLE_ID,
VEGETABLE_NAME,
color
  );

查询验证删除操作

VEGETABLE_ID	VEGETABLE_NAME	COLOR
01	Potato	棕色
02	洋葱	红色
03	南瓜	绿色
04	南瓜	黄色

下一个主题Nth Highest salary

如何在 SQL 中删除重复行？

准备示例数据

(A) 使用 DELETE JOIN 语句删除重复行

(B) 使用中间表删除重复行

(C) 使用 ROW_NUMBER() 函数删除重复行

注意：ROW_NUMBER() 函数自 MySQL 8.02 版本起支持，因此在使用该函数之前，应检查您的 MySQL 版本。

删除 Oracle 中的重复记录

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

SQL 教程

SQL 数据库

SQL 表

SQL Select

SQL 子句

SQL Order By

SQL Insert

SQL Update

SQL Delete

SQL Join

SQL 键

Interview

SQL 多选题

SQL 注入

区别

PL/SQL 教程

其他

SQL 字符串函数

测验

如何在 SQL 中删除重复行？

准备示例数据

(A) 使用 DELETE JOIN 语句删除重复行

(B) 使用中间表删除重复行

(C) 使用 ROW_NUMBER() 函数删除重复行

注意：ROW_NUMBER() 函数自 MySQL 8.02 版本起支持，因此在使用该函数之前，应检查您的 MySQL 版本。

删除 Oracle 中的重复记录

相关帖子

SQL 中的 BIN 函数

SQL LOGICAL OPERATORS

SQL 中的 CHARACTER_LENGTH 函数

SQL 中的 SIGN 函数

SQL 中的 CONCAT 函数

SQL 中的 RAND 函数

SQL View

SQL 中的触发器

SQL Left Outer Join vs Left Join

SQL 算术运算符

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器