mssql sqlserver 三種數據表數據去重方法分享

来源:https://www.cnblogs.com/lairui1232000/archive/2019/02/27/10441616.html
-Advertisement-
Play Games

摘要: 下文將分享三種不同的數據去重方法數據去重:需根據某一欄位來界定,當此欄位出現大於一行記錄時,我們就界定為此行數據存在重覆。 數據去重方法1: 當表中最在最大流水號時候,我們可以通過關聯的方式為每條重覆的記錄獲取唯一值數據去重方法2:為表中記錄,按照指定欄位進行群組,並獲取最大流水號,然後再進 ...


摘要:

下文將分享三種不同的數據去重方法
數據去重:需根據某一欄位來界定,當此欄位出現大於一行記錄時,我們就界定為此行數據存在重覆。



數據去重方法1:

當表中最在最大流水號時候,我們可以通過關聯的方式為每條重覆的記錄獲取唯一值

數據去重方法2:
為表中記錄,按照指定欄位進行群組,並獲取最大流水號,然後再進行去重操作
 
數據去重方法3:
採用分組後,重覆數據組內排名,如果排名大於1代表是重覆數據行數據
 
三種去重方法效率對比:
方法3 > 方法2 > 方法1
 

create table test(keyId int identity,sort varchar(10),
info varchar(20))
go

---方法1 
truncate table test ;

insert into test(sort,info)values('A','maomao365.com')--1
insert into test(sort,info)values('A','貓貓小屋') --2
insert into test(sort,info)values('B','mssql_blog') --3
insert into test(sort,info)values('B','優秀的sql——blog') --4
insert into test(sort,info)values('B','maomao365') --5
insert into test(sort,info)values('C','sql優化blog') --6
go

delete from test where test.keyId = (select max(b.keyId) from test b where test.sort=b.sort);
select * from test 
---方法2:
truncate table test ; 
insert into test(sort,info)values('A','maomao365.com')
insert into test(sort,info)values('A','貓貓小屋')
insert into test(sort,info)values('B','mssql_blog')
insert into test(sort,info)values('B','優秀的sql——blog')
insert into test(sort,info)values('B','maomao365')
insert into test(sort,info)values('C','sql優化blog')
go
delete from test 
where keyid not in(select min(keyId) from test group by sort having count(sort)>=1);
select * from test 
---方法3:
truncate table test ; 
insert into test(sort,info)values('A','maomao365.com')
insert into test(sort,info)values('A','貓貓小屋')
insert into test(sort,info)values('B','mssql_blog')
insert into test(sort,info)values('B','優秀的sql——blog')
insert into test(sort,info)values('B','maomao365')
insert into test(sort,info)values('C','sql優化blog')
go
delete A2 from (
select row_Number() over(partition by sort order by keyid) as keyId_e,* from test 
) as A2 where A2.keyId_e >1

select * from test 
go
drop table test 

 

<img src="http://www.maomao365.com/wp-content/uploads/2018/07/mssql_sqlserver_數據表數據去重的三種方法分享.png" alt="mssql_sqlserver_數據表數據去重的三種方法分享" width="813" height="749" class="size-full wp-image-6767" />

 

轉自:http://www.maomao365.com/?p=6766


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 筆記記錄自林曉斌(丁奇)老師的《MySQL實戰45講》 4) --深入淺出索引(上) 一句話簡單來說,索引的出現其實就是為了提高數據查詢的效率,就像書的目錄一樣。 索引的常見模型 哈希表:哈希表是一種以Key-Value存儲數據的結構,只要輸入key,就可以找到對應的value。哈希的思路很簡單, ...
  • 1、通過information_schema.COLUMNS表 查詢該表可得到所需欄位信息 如下圖所示: 2、示例 下麵截圖是示例: SQL語句如下 3、導出Excel 點擊導出結果即可導出 ...
  • 在https://www.cnblogs.com/loverwangshan/p/10415937.html中我們有講到委托的非同步方法,Thread,ThreadPool,然後今天來講一下Task, ThreadPool相比Thread來說具備了很多優勢,但是ThreadPool卻又存在一些使用上的 ...
  • 同一個賬號,不同客戶端登錄,可以根據user()來記錄IP、判斷是誰在操作。 ...
  • 設計SQL後,應使用explain命令檢查SQL,看是否使用到索引,是否存在filesort,重點檢查檢索的行數(rows)是否太大。 一般來說. 1.rows<1000,是在可接受的範圍內的。 2.rows在1000~1w之間,在密集訪問時可能導致性能問題,但如果不是太頻繁的訪問(頻率低於1分鐘一 ...
  • 資料庫索引,到底是什麼做的? 問題1. 資料庫為什麼要設計索引? 圖書館存了1000W本圖書,要從中找到《架構師之路》,一本本查,要查到什麼時候去? 於是,圖書管理員設計了一套規則: (1)一樓放歷史類,二樓放文學類,三樓放IT類… (2)IT類,又分軟體類,硬體類… (3)軟體類,又按照書名音序排 ...
  • 1. redis事務 使用方法:方法為先發送multi命令告訴redis,下麵所有的命令屬於同一個事務,先不要執行,而是把他們暫時存起來,redis返回OK,然後後面執行需要放在同一個事務里的命令,可以看到每個命令都會返回QUEUED表示這幾條命令已經進入等待執行的事務隊列中了,當需要在同一個事務中 ...
  • 可以使用EXTRACT() 函數。(oracle和mysql都有該函數)語法: EXTRACT(unit FROM date)date 參數是合法的日期表達式。unit 參數可以是下列的值:YEAR\MONTH\WEEK\DAY\HOUR\MINUTE\SECOND (這裡只列出部分常用值)上面依次 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...