Linux下一次刪除百萬文件

来源:http://www.cnblogs.com/blking/archive/2017/12/20/8073167.html
-Advertisement-
Play Games

Linux下一次刪除百萬文件 Linux下一次刪除百萬文件 線上環境遇到的一個問題,文件數量過多,執行rm命令報錯 # rm -f ./* -bash: /bin/rm: Argument list too long # rm -f ./* -bash: /bin/rm: Argument list ...


Linux下一次刪除百萬文件

線上環境遇到的一個問題,文件數量過多,執行rm命令報錯

# rm -f ./*

-bash: /bin/rm: Argument list too long

根據報錯檢查狀態

# ls | wc -l

634084

# du -sh

64G

線上下環境進行故障復現

測試環境準備

# df -Th

Filesystem     Type   Size  Used Avail Use% Mounted on

/dev/sda3      ext4   1.8T  331G  1.4T  20% /

tmpfs          tmpfs  7.7G     0  7.7G   0% /dev/shm

/dev/sda1      ext4   190M   61M  120M  34% /boot

# grep name /proc/cpuinfo

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

model name      : Intel(R) Xeon(R) CPU E5-2609 v3 @ 1.90GHz

# free -m

             total       used       free     shared    buffers     cached

Mem:         15709       1643      14066          8        452        559

-/+ buffers/cache:        631      15078

Swap:         8191          0       8191

# cat /etc/redhat-release

CentOS release 6.8 (Final)

# uname -r

2.6.32-642.1.1.el6.x86_64

測試生成測試數據

# for i in `seq 1000000`;do echo "${i}" >> ${i}.txt;done

# ls | wc -l

1000000

# du -sh

3.9G .

# ls *.txt

-bash: /bin/ls: Argument list too long

# rm -f ./*

-bash: /bin/rm: Argument list too long

 

 

方法1:使用for迴圈方式執行刪除任務

# time for i in `ls ./`;do rm -f ${i};done

 

real   58m44.234s

user  8m59.930s

sys    37m16.453s

時間太長了,絕壁不能忍

 

 

方法2:直接刪目錄

# time rm -rf test && mkdir test

 

real   0m56.768s

user  0m1.453s

sys    0m22.603s

# du -sh test

4.0K  test

速度不錯,然而很多情況下不能直接刪目錄,有點蛋疼

 

 

方法3:使用 find + xargs 組合命令執行刪除任務(網上流傳最多的方法)

# time find ./ -type f | xargs -n 1 rm -f

 

real   18m30.267s

user  0m9.536s

sys    1m38.999s

 

# time find ./ -type f | xargs rm -f

 

real   16m16.774s

user  0m2.232s

sys    0m30.454s

一樣蛋疼,如果需求是刪除全部文件的話,用這種方法就太low了,適合刪除部分數據的場景

 

 

方法4:使用 ls + xargs 組合命令執行刪除任務

# time ls | xargs -L 100 rm -f

 

real   1m3.801s

user  0m7.054s

sys    0m28.582s

 

# time ls | xargs -L 1000 rm -f

 

real   0m55.917s

user  0m5.322s

sys    0m24.778s

 

# time ls | xargs -L 2000 rm -f

 

real   0m55.560s

user  0m5.209s

sys    0m24.702s

 

# time ls | xargs -L 5000 rm -f

 

real   0m55.057s

user  0m5.196s

sys    0m24.666s

 

# time ls | xargs -L 10000 rm -f

 

real   0m55.733s

user  0m5.121s

sys    0m24.657s

 

# time ls | xargs -L 100000 rm -f

xargs: argument list too long

 

real   0m4.018s

user  0m3.324s

sys    0m0.701s

速度杠杠滴~~但是註意文件名長度,選擇合適的傳參數量

 

 

方法5:使用rsync命令來執行刪除任務

# mkdir /tmp/Null

# time rsync --delete-before -d /tmp/Null/ ./

 

real   0m56.386s

user  0m1.767s

sys    0m28.075s

# ll

total 0

# du -sh ./

29M ./

 沒什麼優點,缺點是rsync命令比較冷門,參數不容易記住,用的機會也不多,作為拓展方法瞭解一下就好

 

如果你有其他好的方法,可以一起探討一下~~

 

 

原創文章,侵權必究

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1首先來講講應用程式如何實現系統調用(用戶態->內核態)? 我們以應用程式的write()函數為例: 1)首先用戶態的write()函數會進入glibc庫,裡面會將write()轉換為swi(Software Interrupt)指令,從而產生軟體中斷,swi指令如下所示: 2)然後CPU會跳到異常 ...
  • 現在的公司一般都會有很多內部管理系統,比如OA、ERP、CRM、郵件系統等。員工入職之後如果每個系統都創建一個賬號和密碼,首先員工記系統賬號就是一件非常頭疼的事情,如果公司有一百個系統那就得創建一百個賬號(所在的公司就有估計200個系統、8萬員工)。就算我們用日記本把賬號統一記錄起來,可以解決賬號登 ...
  • 最近有個小項目需要安裝10台顯卡為Quadro K620的機子,期間查看了許多教程都不太完整,所以整理了一下,把自己成功的經驗分享給大家,給自己寫博客開個小頭,有問題可以留言。 系統版本:CentOS7 CUDA版本:CUDA-9.1 安裝方式:離線U盤拷貝,控制台界面,cuda.run包安裝(不需 ...
  • 1.chgrp——改變所屬群組 每個檔案都有三個屬性,擁有者、群組、其他人,chgrp就可以更改檔案的群組,如下 上面1.txt和2.txt的群組都是zyj,相當於在zyj群組中的用戶都只能讀取檔案1.txt和2.txt 接下來我們改變檔案的群組為root後就可以修改檔案的內容了,如下 2.chow ...
  • 推輓輸出,可以輸出高電平,連接數字器件: 輸出0時,N-MOS導通,P-MOS高阻,輸出0。 輸出1時,N-MOS高阻,P-MOS高阻,輸出1;(不需要外部上拉電阻) 開漏輸出: 輸出端相當於三極體的集電極,要得到高電平狀態需要上拉電阻才行,適合做電流型驅動; 輸出0時,N-MOS導通,P-MOS不 ...
  • 1.什麼操作出現:當我在項目中添加產品或者修改時,瀏覽器出現HTTP Status 500 Request processing failed; nested exception is org.hibernate.exception.GenericJDBCException: could not e ...
  • #!/usr/bin/expect -f set pwffd [lindex $argv 0] spawn ssh cmesvr2i expect "*password:" send "$pwffd\r" expect "*#" interact ...
  • 二周第三次課(12月20日)2.14 更改文件和目錄許可權chmod 2.15 更改所有者和所屬組chown2.16 umask2.17 隱藏許可權lsattr/chattr 更改文件和目錄許可權:命令:#chmod >> change mode (-R=文件所有者·文件所屬組·其他用戶一起更改) # r ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...