orcl資料庫查詢重覆數據及刪除重覆數據方法

-Advertisement-

工作中，發現資料庫表中有許多重覆的數據，而這個時候老闆需要統計表中有多少條數據時（不包含重覆數據），只想說一句MMP，庫中好幾十萬數據，腫麽辦，無奈只能自己在網上找語句，最終成功解救，下麵是我一個實驗，很好理解。假設有一張人員信息表cs（姓名，證件號，地址），將表中三個欄位數據都重覆的數據篩選出來 ...

工作中，發現資料庫表中有許多重覆的數據，而這個時候老闆需要統計表中有多少條數據時（不包含重覆數據），只想說一句MMP，庫中好幾十萬數據，腫麽辦，無奈只能自己在網上找語句，最終成功解救，下麵是我一個實驗，很好理解。

------------------------------------------------------------------------------------------------------------------------

假設有一張人員信息表cs（姓名，證件號，地址），將表中三個欄位數據都重覆的數據篩選出來：

distinct:這個關鍵字來過濾掉多餘的重覆數據只保留一條數據

select * from from cs ------所有欄位

select distinct xm,zjh,dz from cs; -----指定欄位

在實踐中往往只用它來返回不重覆數據的條數，因為distinct對於一個數據量非常大的庫來說，無疑是會直接影響到效率的。

-----------------------------------------------------------------------------------------------------------------------

查詢重覆數據、刪除重覆數據的方法如下：↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

①rowid用法： oracle帶的rowid屬性,進行判斷是否存在重覆數據。

查詢重覆數據：

select a.* from cs a where rowid !=(select max(rowid) from cs b where a.xm=b.xm and a.zjh=b.zjh and a.dz=b.dz)

刪除重覆數據：

delete from cs a where rowid !=(select max(rowid) from cs b where a.xm=b.xm and a.zjh=b.zjh and a.dz=b.dz)

②group by ：一般用於將查詢結果分組，多配合聚合函數，sum，count，min，max,having等一起使用。

查詢重覆數據：

select max(xm),max(zjh),max(dz),count(xm) as 記錄數 from cs group by xm having count(xm)>1 ---------適用於欄位少的

select * from cs a where (a.xm,a.zjh,a.dz) in (select xm,zjh,dz from cs group by xm,zjh,dz having count(*)>1)

and rowid not in (select min(rowid) from cs group by xm,zjh,dz having count(*)>1) -------適用於多欄位

去重重覆數據：多個欄位，只留有rowid最小的記錄。

delete from cs a where (a.xm,a.zjh,a.dz) in (select xm,zjh,dz from cs group by xm,zjh,dz having count(*)>1) and rowid not in (select min(rowid) from cs group by xm,zjh,dz having count(*)>1)

③row_number()over(partition by 列)

select xm,zjh,dz,row_number()over(partition by zjh order by xm) 記錄號 from cs

去重重覆數據：

with cs1 as (select xm,zjh,dz,row_number()over(partition by zjh order by zjh) 記錄號 from cs)select * from cs1 where 記錄號=1

感謝您的閱讀，如果您覺得閱讀本文對您有幫助，請點一下“推薦”按鈕。本文歡迎各位轉載，但是轉載文章之後必須在文章頁面中給出作者和原文連接。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Linux進程調度器概述--Linux進程的管理與調度(十五）

調度器面對的情形就是這樣, 其任務是在程式之間共用CPU時間, 創造並行執行的錯覺, 該任務分為兩個不同的部分, 其中一個涉及調度策略 , 另外一個涉及上下文切換 . 1 背景知識 1.1 什麼是調度器通常來說，操作系統是應用程式和可用資源之間的媒介。典型的資源有記憶體和物理設備。但是CPU也 ...
Linux：Gentoo系統的安裝筆記（四）

本來以為結束，誰知離正常的系統還是比較遠，不過不放棄，這期的筆記我敢肯定是最後一期了，寫了那麼多我也覺得煩，被gentoo折磨煩了。安裝KDE桌面選擇正確的配置文件先獲取root許可權來安裝桌面環境：先eselect profile list來看看配置正，如果選不對的話KDE桌面環境是無法正常 ...
Linux編程 13 (系統環境變數位置，環境變數持久化)

一.系統環境變數位置在上章中，知道瞭如何修改系統環境變數，如PATH變數，以及創建自己的全局環境變數和局部環境變數。這篇學習怎麼讓環境變數的作用持久化。在此之前，先瞭解下系統環境變數文件會在哪些位置，當使用bash shell時，bash是如何查找環境變數位置的。下麵先來介紹幾個文件，這些文件叫啟 ...
device eth0 does not seem to be present..VMware虛擬機網路問題

【問題來源】因為虛擬機過大，所以直接在本地磁碟直接複製，啟動的時候，換好IP重新啟動網卡報錯。 device eth0 does not seem to be present.. ifconfig查看發現沒有網卡存在【解決方法】第一步：將網卡eth0改為eth1 第二步: 查看eth1的ma ...
shell定時統計Nginx下access.log的PV併發送給API保存到資料庫

shell定時統計Nginx下access.log的PV併發送給API保存到資料庫 ...
小規模集群架構規劃

"配置無人值守批量安裝系統（Cobbler）" "搭建PPTP VPN/ NTP/Firewalld內部共用上網 " "搭建跳板機服務jumpserver" "MySQL資料庫環境搭建" "MySQL資料庫主從搭建" "Memcahced/Redis 實現Session會話保持" "Rsync全網備 ...
Linux忘記root密碼，密碼找回，圖片展示

忘記root密碼 CentOS 7參考地址如下：https://www.baidu.com/s?wd=CentOS7+%E6%89%BE%E5%9B%9Eroot%E5%AF%86%E7%A0%81&ie=UTF-8 CentOS 6版本如下：在下麵這個界面按任意鍵，這個時候儘快按下任意鍵，只有5 ...
SQL Server基礎之表級觸發器

觸發器分為兩種，一種與數據表綁定，響應數據表指定動作（insert、delete或update），此處稱為表級；一種與資料庫本身綁定，響應數據定義語句（主要是CREATE、ALTER 和 DROP 開頭的語句），此處稱為庫級。本篇以下所說觸發器皆指表級觸發器。觸發器是一段有特定語法，實現一定功能的 ...