Linux下快速比較兩個目錄的不同

来源:https://www.cnblogs.com/f-ck-need-u/archive/2018/05/22/9071033.html
-Advertisement-
Play Games

曾多次想要在Linux下比較目錄a和目錄b中 文件列表 的差別,然後對目錄a比目錄b中多出的文件、少掉的文件分別做處理。但是,在網上搜索了多次也都沒找到能直接處理好的工具。 所以想了很多不少方法,自我感覺都不錯,而且網上似乎沒有這方面的文章,所以分享出來給大家。如果各位有更好的工具或者方法,盼請留下 ...


曾多次想要在Linux下比較目錄a和目錄b中文件列表的差別,然後對目錄a比目錄b中多出的文件、少掉的文件分別做處理。但是,在網上搜索了多次也都沒找到能直接處理好的工具。

所以想了很多不少方法,自我感覺都不錯,而且網上似乎沒有這方面的文章,所以分享出來給大家。如果各位有更好的工具或者方法,盼請留下說明(本文第2部分:圖形化的比較結果搜集自網上,我也沒有在圖形化界面下操作的需要,所以沒有多做介紹)

以下是本文有些地方涉及到的目錄結構。

[root@node1 ~]# tree directory1 directory2
directory1
├── 1.png
├── 2.png
└── 3.png
directory2
├── 2.png
├── 3.png
└── 4.png

1.命令行輸出的結果

方法一:使用diff

diff -r directory1 directory2

但是diff會對每個文件中的每一行都做比較,所以文件較多或者文件較大的時候會非常慢。請謹慎使用。

方法二:使用diff結合tree

diff <(tree -Ci --noreport /mnt/f/自然馬) <(tree -Ci --noreport /mnt/i/自然馬)
< /mnt/f/自然馬
---
> /mnt/i/自然馬
87a88
> xyz.avi
488d488
< rsync.txt
534d533
< 542D0.mp4

說明:

  1. tree的-C選項是輸出顏色,如果只是看一下目錄的不同,可以使用該選項,但在結合其他命令使用的時候建議不要使用該選項,因為顏色也會轉換為對應的編碼而輸出;
  2. -i是不縮進,建議不要省略-i,否則diff的結果很難看,也不好繼續後續的文件操作;
  3. --noreport是不輸出報告結果,建議不要省略該選項。
  4. 該方法效率很高。

方法三:find結合diff

find directory1 -printf "%P\n" | sort > file1
find directory2 -printf "%P\n" | sort | diff file1 -
2d1
< 1.png
4a4
> 4.png

說明:

  1. <代表的行是directory1中有而directory2沒有的文件,>則相反,是directory2中有而directory1中沒有。
  2. 不要省略-printf "%P\n",此處的%P表示find的結果中去掉首碼路徑,詳細內容man find。例如,find /root/ -printf "%P\n"的結果中將顯示/root/a/xyz.txt中去掉/root/後的結果:a/xyz.txt。
  3. 效率很高,輸出也簡潔。

如果不想使用-printf,那麼先進入各目錄再find也行。

[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1)       
[root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -)
2d1
< ./1.png
4a4
> ./4.png

上面將命令放進括弧中執行是為了在子shell中切換目錄,不用影響當前所在目錄。

方法四:使用rsync

rsync -rvn --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
deleting a/xyz.avi
rsync.txt
新建文件夾/542D0.mp4

其中deleting所在的行就是directory2中多出的文件。其他的都是directory中多出的文件。

如果想區分出不同的是目錄還是文件。可以加上"-i"選項。

rsync -rvn -i --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'
*deleting   a/xyz.avi
>f+++++++++ rsync.txt
>f+++++++++ 新建文件夾/542D0.mp4

其中>f+++++++++中的f代表的是文件,d代表的目錄。

上面的rsync比較目錄有幾點要說明:

  1. 一定不能缺少-n選項,它表示dry run,也就是試著進行rsync同步,但不會真的同步。
  2. 第一個目錄(directory1/)後一定不能缺少斜線,否則表示將directory1整個目錄同步到directory2目錄下。
  3. 其它選項,如"-r -v --delete"也都不能缺少,它們的意義想必都知道。
  4. sed的作用是過濾掉和文件不相關的內容。
  5. 以上rsync假定了比較的兩個目錄中只有普通文件和目錄,沒有軟鏈接、塊設備等特殊文件。如果有,請考慮加上對應的選項或者使用-a替代-r,否則結果中將出現skipping non-regular file的提示。但請註意,如果有軟鏈接,且加了對應選項(-l或-a或其他相關選項),則可能會出現fileA-->fileB的輸出。
  6. 效率很高,因為rsync的原因,篩選的可定製性也非常強。

2.圖形化的比較結果

方法一:使用vimdiff

vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort)
# 或者
vimdiff <(find directory1 -printf "%P\n"| sort) <(find directory2 -printf "%P\n"| sort)

方法二:使用meld

meld是python寫的一個圖形化文件/目錄比較工具,所以必須先安裝圖形界面或設置好圖形界面接受協議。它的功能非常豐富,和win下的beyond compare有異曲同工之妙。

meld具體的使用方式就不介紹了。

3.將兩目錄中不同的文件篩選出來

個人建議使用命令行輸出的結果中的方法方法三和方法四,因為它們都能很好地保留目錄首碼。

以方法三為例:

find directory1 -printf "%P\n" | sort > file1
find directory2 -printf "%P\n" | sort | diff file1 -

以下是實驗所需目錄結構:

[root@node1 ~]# tree /root/a;tree /root/b 
/root/a
├── 1.png
├── 2.png
└── 3.png

0 directories, 3 files
/root/b
├── 2.png
├── 3.png
├── 4.png
└── xen
    └── scripts
        └── block-drbd

首先比較這兩個目錄得到文件列表的差異。

find /root/a -printf "%P\n" | sort > /tmp/file1
find /root/b -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt

然後從diff.txt中過濾出/root/a中多出的文件和/root/b中多出的文件。

# /root/a中多出的文件
awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen
/tmp/etc/xen/scripts
/tmp/etc/xen/scripts/block-drbd

需要註意的是,如果多了某個目錄,則這個目錄和其內所有文件都會列出來。如果要將多出的文件複製到其他地方,應當要註意這一點。

如果只想要比較出/root/a和/root/b下的文件和目錄的不同,不再遞歸到子目錄中比較。那麼可以在find上繼續加工一番:

find /root/a -maxdepth 1 -printf "%P\n" | sort > /tmp/file1
find /root/b -maxdepth 1 -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt
# /root/a中多出的文件
awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/1.png

# /root/b中多出的文件
awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt
/tmp/etc/4.png
/tmp/etc/xen

這樣一來,/root/b中多出的文件就是4.png和xen,xen目錄中的文件不再列出。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、 實驗拓撲圖: 2、 實驗要求 (1) 新建一臺exsi主機,安裝exsi5.5系統。 步驟: 1)新建虛擬機,導入光碟。 2)安裝esxi系統 (2)在exsi主機中,配置IP地址為192.168.10.10,首選dns為202.106.0.20 步驟:1)配置ip和dns後退出 配置完成後按 ...
  • 問題: 最近在使用 wget ,感覺有很多的功能都不會,現在進行寫一篇文章,更新一些wget的使用技巧,防止以後忘記的時候,重新回來進行查閱。 正文: 未完。 ...
  • 在開始先來看一個有意思的東西: 結果是負數!!!! 這個結果理論上是非常不應該的,這已經違背了我們的常識,畢竟正數的乘積,最後的結果應該還是一個正數,但是這裡出現負數的情況,雖然結果不對,但是好在即使我們各種交換順序,結果都是一致的 我們再來試試浮點數呢 從結果看浮點數好像也沒好到哪裡去,也算錯了, ...
  • Nginx使用Location匹配URL進行偽靜態,location [ = | ~ | ~* | ^~ ] uri { ... }中=、~、~*、^*、^~等的區別。 ...
  • 本文配置可實現:集群伺服器之間相互可以ssh免密登錄。若只想從單一機器(如master)ssh免密登錄其他機器(slave1、slave2),則只跟著操作到第二步即可。 建議先花兩三分鐘把全文看完再跟著步驟操作 操作步驟: 1.集群環境:master、slave1和slave2;操作系統為Cento ...
  • 一、安裝與配置 1.設置阿裡雲鏡像源 2.安裝依賴包 3.安裝 Docker CE 重建 Yum 緩存。 安裝 Docker CE ,請執行一下命令進行安裝: 4.啟動 Docker CE 5. [可選] 為 Docker 建立用戶組 docker 命令與 Docker 引擎通訊之間通過 UnixS ...
  • sed 字元串替換 1. sed替換的基本語法為: sed 's/原字元串/替換字元串/' 單引號裡面,s表示替換,三根斜線中間是替換的樣式,特殊字元需要使用反斜線”\”進行轉義。 2. 單引號” ‘ ’”是沒有辦法用反斜線”\”轉義的,這時候只要把命令中的單引號改為雙引號就行了,格式如下: # 要 ...
  • 一般來說,構建一個 Windows 程式可以分為如下幾個步驟:定義視窗類(WNDCLASS)註冊視窗類(RegisterClass)創建視窗(CreateWindow)更新顯示視窗(UpdateWindow、ShowWindow)建立消息迴圈(GetMessage)處理消息(DispatchMess... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...