MS SQL Server 刪除重覆行數據_ZenDei技術網路在線

MS SQL Server 刪除重覆行數據

-Advertisement-

您可以使用以下 SQL 語句刪除 MS SQL Server 表中重覆的行： WITH CTE AS ( SELECT ROW_NUMBER() OVER(PARTITION BY column1, column2, ... columnN ORDER BY (SELECT 0)) RN FROM ...

您可以使用以下 SQL 語句刪除 MS SQL Server 表中重覆的行：

WITH CTE AS (
  SELECT ROW_NUMBER() OVER(PARTITION BY column1, column2, ... columnN ORDER BY (SELECT 0)) RN
  FROM table_name
)
DELETE FROM CTE WHERE RN > 1;

您需要將 table_name 替換為要刪除重覆行的表名，並將 column1, column2, ... columnN 替換為用於檢查重覆的列名。該語句使用 ROW_NUMBER() 函數和 PARTITION BY 子句來標識重覆的行，然後使用 DELETE 語句刪除其中一個副本。

這樣說有些抽象，下麵舉一個例子：

比如我有一個deadUrlRecord_copy1 表，存的數據如下格式。

這個表存在一個問題，url列有一部分是重覆的。用group by語句可以查出來，有挺多重覆的，那麼，如何刪除多餘的數據，只保留一條呢？

這就要採用文章開頭給出的語句了。

WITH cte AS (
    SELECT url,
           ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn
    FROM deadUrlRecord_copy1
    WHERE status = 'NotFound'
)
DELETE FROM cte WHERE rn > 1;

乍一看一臉懵逼，但是執行發現竟然成功刪除了重覆數據，達到了預期效果，為什麼呢？

這要解釋下這一行代碼：

ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn

這是一種 SQL 語法，用於對一個查詢結果集的行進行編號，並且可以根據特定列來分組編號。

具體來說，ROW_NUMBER() 是一個視窗函數，它會為查詢結果集中每一行計算一個行號。而 OVER 子句則是指定如何定義視窗（window），也就是要給哪些行計算行號。在這個例子中，PARTITION BY url 表示按照 url 這一列進行分組，也就是說對於每個不同的 url 分別計算行號；ORDER BY url 則表示按照 url 這一列進行排序，這樣同一個 url 中的行就會按照 url 的值依次排列。最後，AS rn 則是給這個新的行號列起個名字，即 rn。

例如，假設有如下表格：

id	url
1	www.example.com
2	www.example.com
3	www.example.com/foo
4	www.example.com/bar
5	www.google.com

如果執行以下 SQL 查詢：

SELECT id, url, ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn FROM my_table;

則會得到以下結果：

id	url	rn
1	www.example.com	1
2	www.example.com	2
3	www.example.com/foo	1
4	www.example.com/bar	1
5	www.google.com	1

其中，同一個 url 中的行擁有相同的行號，同時這個行號是按照 url 的值進行排序的。

然後執行剛纔那段代碼的片段試一下，可能更好理解：

url不同的，行號都是1。相同的，會從1開始排序，所有就出現了2.

然後用 DELETE FROM cte WHERE rn > 1; 刪除行號>1的數據，就成功把多餘的數據刪除了，非常巧妙。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Ubuntu硬碟掛載

近些年，因為某些原因，我們常常在家遠程研發業務，當某些程式或業務代碼在公司電腦上時，就需要訪問公司電腦遠程操作， SSH 登錄 Linux 是一種非常常見的方式，但是在一些情況下，SSH 無法直接連接，給遠程管理伺服器帶來不便伺服器有防火牆限制，SSH 埠無法直接連接伺服器在內網環境，沒有可供 ...
嵌入式軟體測試的10條秘訣

在嵌入式軟體開發過程中，花在測試和花在編碼的時間比通常在3:1左右（實際上可能更多）。這個比例會隨著工程師編程、測試水平的提高而不斷下降，但無論如何，軟體測試都是嵌入式軟體開發中至關重要的部分。多年前，一位工程師為了對嵌入式擁有更深層次理解的追求，曾發出這樣的疑問：“我怎麼才能知道並懂得我的系統到 ...
linux下安裝 Elasticsearch 7.x (手把手教學)

1.導入 Elasticsearch GPG KEY: rpm --import ./GPG-KEY-elasticsearch or apt-key add ./GPG-KEY-elasticsearch 2.添加elasticsearch的yum repo文件 vim /etc/yum.repo ...
Centos 7.9 安裝 MySQL 8.0.32

第一步、下載壓縮包下載社區版的 MySQL，根據需求下載對應版本，其中有最小安裝版本。具體各個版本的區別，可以上網查詢，鏈接 MySQL :: Download MySQL Community Server 第二步，解壓壓縮包，並複製到安裝目錄進入到壓縮包所在的文件夾，解壓分為兩次，第一次解 ...
Linux開機自啟動

使用 NMCLI 配置靜態乙太網連接要在命令行上配置乙太網連接，請使用 nmcli 工具。例如，以下流程使用以下設置為 enp7s0 設備創建 NetworkManager 連接配置文件：靜態 IPv4 地址 - 192.0.2.1 和 /24 子網掩碼靜態 IPv6 地址 - 2001:d ...
Centos7系統在開啟進入系統報錯：Give root password for maintenance（or type Control-D to continue）:問題解決方法

報錯信息：在進入系統時，不能正常進入系統，出現了Give root password for maintenance（or type Control-D to continue）：的報錯。報錯原因： 1、在之前寫入的/etc/fstab文件有問題，導致系統在讀取的時候識別不到從而報錯。解決方法 ...
Linux進程通信 | 消息隊列

什麼是消息隊列？假設你是一個快遞員，你需要將貨物從一個倉庫運到另一個倉庫。但是你發現自己的時間不夠用，需要另外請一個人來幫忙。那麼，你們之間如何進行協作呢？一種方式是直接將貨物全部交給對方，但這樣存在風險：對方可能會出現問題，導致貨物丟失或損壞。而另一種更安全的方式是，你將貨物分批發送給對方， ...
day11-MySql存儲結構

MySql存儲結構參考視頻：MySql存儲結構 1.表空間不同的存儲引擎在磁碟文件上的結構均不一致，這裡以InnoDB為例： CREATE TABLE t(id int(11)) Engine = INNODB; 在新表創建的過程中，InnoDB會在磁碟的data目錄下創建與這個表對應的兩個文件 ...