MS SQL Server 刪除重覆行數據

来源:https://www.cnblogs.com/xieweikang/archive/2023/03/17/17227386.html
-Advertisement-
Play Games

您可以使用以下 SQL 語句刪除 MS SQL Server 表中重覆的行: WITH CTE AS ( SELECT ROW_NUMBER() OVER(PARTITION BY column1, column2, ... columnN ORDER BY (SELECT 0)) RN FROM ...


 

您可以使用以下 SQL 語句刪除 MS SQL Server 表中重覆的行:

WITH CTE AS (
  SELECT ROW_NUMBER() OVER(PARTITION BY column1, column2, ... columnN ORDER BY (SELECT 0)) RN
  FROM table_name
)
DELETE FROM CTE WHERE RN > 1;

您需要將 table_name 替換為要刪除重覆行的表名,並將 column1, column2, ... columnN 替換為用於檢查重覆的列名。該語句使用 ROW_NUMBER() 函數和 PARTITION BY 子句來標識重覆的行,然後使用 DELETE 語句刪除其中一個副本。

這樣說有些抽象,下麵舉一個例子:

比如我有一個deadUrlRecord_copy1 表,存的數據如下格式。

img

這個表存在一個問題,url列有一部分是重覆的。用group by語句可以查出來,有挺多重覆的,那麼,如何刪除多餘的數據,只保留一條呢?

img

這就要採用文章開頭給出的語句了。

WITH cte AS (
    SELECT url,
           ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn
    FROM deadUrlRecord_copy1
    WHERE status = 'NotFound'
)
DELETE FROM cte WHERE rn > 1;

乍一看一臉懵逼,但是執行發現竟然成功刪除了重覆數據,達到了預期效果,為什麼呢?

這要解釋下這一行代碼:

ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn  

這是一種 SQL 語法,用於對一個查詢結果集的行進行編號,並且可以根據特定列來分組編號。

 

具體來說,ROW_NUMBER() 是一個視窗函數,它會為查詢結果集中每一行計算一個行號。而 OVER 子句則是指定如何定義視窗(window),也就是要給哪些行計算行號。在這個例子中,PARTITION BY url 表示按照 url 這一列進行分組,也就是說對於每個不同的 url 分別計算行號;ORDER BY url 則表示按照 url 這一列進行排序,這樣同一個 url 中的行就會按照 url 的值依次排列。最後,AS rn 則是給這個新的行號列起個名字,即 rn

例如,假設有如下表格:

idurl
1 www.example.com
2 www.example.com
3 www.example.com/foo
4 www.example.com/bar
5 www.google.com

如果執行以下 SQL 查詢:

SELECT id, url, ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn FROM my_table;

則會得到以下結果:

idurlrn
1 www.example.com 1
2 www.example.com 2
3 www.example.com/foo 1
4 www.example.com/bar 1
5 www.google.com 1

其中,同一個 url 中的行擁有相同的行號,同時這個行號是按照 url 的值進行排序的。


然後執行剛纔那段代碼的片段試一下,可能更好理解:

img

url不同的,行號都是1。相同的,會從1開始排序,所有就出現了2.

然後用 DELETE FROM cte WHERE rn > 1;  刪除行號>1的數據,就成功把多餘的數據刪除了,非常巧妙。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 近些年,因為某些原因,我們常常在家遠程研發業務,當某些程式或業務代碼在公司電腦上時,就需要訪問公司電腦遠程操作, SSH 登錄 Linux 是一種非常常見的方式,但是在一些情況下,SSH 無法直接連接,給遠程管理伺服器帶來不便 伺服器有防火牆限制,SSH 埠無法直接連接 伺服器在內網環境,沒有可供 ...
  • 在嵌入式軟體開發過程中,花在測試和花在編碼的時間比通常在3:1左右(實際上可能更多)。這個比例會隨著工程師編程、測試水平的提高而不斷下降,但無論如何,軟體測試都是嵌入式軟體開發中至關重要的部分。 多年前,一位工程師為了對嵌入式擁有更深層次理解的追求,曾發出這樣的疑問:“我怎麼才能知道並懂得我的系統到 ...
  • 1.導入 Elasticsearch GPG KEY: rpm --import ./GPG-KEY-elasticsearch or apt-key add ./GPG-KEY-elasticsearch 2.添加elasticsearch的yum repo文件 vim /etc/yum.repo ...
  • ​ 第一步、下載壓縮包 下載社區版的 MySQL,根據需求下載對應版本,其中有最小安裝版本。具體各個版本的區別,可以上網查詢,鏈接 MySQL :: Download MySQL Community Server 第二步,解壓壓縮包,並複製到安裝目錄 進入到壓縮包所在的文件夾,解壓分為兩次,第一次解 ...
  • 使用 NMCLI 配置靜態乙太網連接 要在命令行上配置乙太網連接,請使用 nmcli 工具。 例如,以下流程使用以下設置為 enp7s0 設備創建 NetworkManager 連接配置文件: 靜態 IPv4 地址 - 192.0.2.1 和 /24 子網掩碼 靜態 IPv6 地址 - 2001:d ...
  • 報錯信息: 在進入系統時,不能正常進入系統,出現了Give root password for maintenance(or type Control-D to continue):的報錯。 報錯原因: 1、在之前寫入的/etc/fstab文件有問題,導致系統在讀取的時候識別不到從而報錯。 解決方法 ...
  • 什麼是消息隊列? 假設你是一個快遞員,你需要將貨物從一個倉庫運到另一個倉庫。但是你發現自己的時間不夠用,需要另外請一個人來幫忙。那麼,你們之間如何進行協作呢? 一種方式是直接將貨物全部交給對方,但這樣存在風險:對方可能會出現問題,導致貨物丟失或損壞。 而另一種更安全的方式是,你將貨物分批發送給對方, ...
  • MySql存儲結構 參考視頻:MySql存儲結構 1.表空間 不同的存儲引擎在磁碟文件上的結構均不一致,這裡以InnoDB為例: CREATE TABLE t(id int(11)) Engine = INNODB; 在新表創建的過程中,InnoDB會在磁碟的data目錄下創建與這個表對應的兩個文件 ...
一周排行
    -Advertisement-
    Play Games
  • 背景 在瀏覽器中訪問本地靜態資源html網頁時,可能會遇到跨域問題如圖。 是因為瀏覽器預設啟用了同源策略,即只允許載入與當前網頁具有相同源(協議、功能變數名稱和埠)的內容。 WebView2預設情況下啟用了瀏覽器的同源策略,即只允許載入與主機相同源的內容。所以如果我們把靜態資源發佈到iis或者通過node ...
  • 最近看幾個老項目的SQL條件中使用了1=1,想想自己也曾經這樣寫過,略有感觸,特別拿出來說道說道。編寫SQL語句就像炒菜,每一種調料的使用都會影響菜品的最終味道,每一個SQL條件的加入也會影響查詢的執行效率。那麼 1=1 存在什麼樣的問題呢?為什麼又會使用呢? ...
  • 好久不見,我又回來了。 給大家分享一個我最近使用c#代碼操作ftp伺服器的代碼示例: 1 public abstract class FtpOperation 2 { 3 /// <summary> 4 /// FTP伺服器地址 5 /// </summary> 6 private string f ...
  • 一:背景 1. 講故事 過年喝了不少酒,腦子不靈光了,停了將近一個月沒寫博客,今天就當新年開工寫一篇吧。 去年年初有位朋友找到我,說他們的系統會偶發性崩潰,在網上也發了不少帖子求助,沒找到自己滿意的答案,讓我看看有沒有什麼線索,看樣子這是一個牛皮蘚的問題,既然對方有了dump,那就分析起來吧。 二: ...
  • 自己製作的一個基於Entity Framework Core 的資料庫操作攔截器,可以列印資料庫執行sql,方便開發調試,代碼如下: /// <summary> /// EF Core 的資料庫操作攔截器,用於在資料庫操作過程中進行日誌記錄和監視。 /// </summary> /// <remar ...
  • 本文分享自華為雲社區《Go併發範式 流水線和優雅退出 Pipeline 與 Cancellation》,作者:張儉。 介紹 Go 的併發原語可以輕鬆構建流數據管道,從而高效利用 I/O 和多個 CPU。 本文展示了此類pipelines的示例,強調了操作失敗時出現的細微之處,並介紹了乾凈地處理失敗的 ...
  • 在上篇文章中,我們介紹到在多線程環境下,如果編程不當,可能會出現程式運行結果混亂的問題。出現這個原因主要是,JMM 中主記憶體和線程工作記憶體的數據不一致,以及多個線程執行時無序,共同導致的結果。 ...
  • 1、下載安裝包首先、進入官網下載安裝包網址:https://www.python.org/downloads/windows/下載步驟:進入下載地址,根據自己的電腦系統選擇相應的python版本 選擇適配64位操作系統的版本(查看自己的電腦操作系統版本), 點擊下載安裝包 也可以下載我百度雲分享的安 ...
  • 簡介 git-commit-id-maven-plugin 是一個maven 插件,用來在打包的時候將git-commit 信息打進jar中。 這樣做的好處是可以將發佈的某版本和對應的代碼關聯起來,方便查閱和線上項目的維護。至於它的作用,用官方說法,這個功能對於大型分散式項目來說是無價的。 功能 你 ...
  • 序言 在數字時代,圖像生成技術正日益成為人工智慧領域的熱點。 本討論將重點聚焦於兩個備受矚目的模型:DALL-E和其他主流AI繪圖方法。 我們將探討它們的優勢、局限性以及未來的發展方向。通過比較分析,我們期望能夠更全面地瞭解這些技術,為未來的研究和應用提供啟示。 Q: 介紹一下 dall-e Ope ...