Linux入門時必學文件處理個命令

来源:http://www.cnblogs.com/atstudy/archive/2017/02/09/6381023.html
-Advertisement-
Play Games

Linux系統信息存放在文件里,文件與普通的公務文件類似。每個文件都有自己的名字、內容、存放地址及其它一些管理信息,如文件的用戶、文件的大小等。文件可以是一封信、一個通訊錄,或者是程式的源語句、程式的數據,甚至可以包括可執行的程式和其它非正文內容。Linux文件系統具有良好的結構,系統提供了很多文件 ...


Linux系統信息存放在文件里,文件與普通的公務文件類似。每個文件都有自己的名字、內容、存放地址及其它一些管理信息,如文件的用戶、文件的大小等。文件可以是一封信、一個通訊錄,或者是程式的源語句、程式的數據,甚至可以包括可執行的程式和其它非正文內容。Linux文件系統具有良好的結構,系統提供了很多文件處理程式。這裡主要介紹常用的文件處理命令。

file

1.作用

file通過探測文件內容判斷文件類型,使用許可權是所有用戶。

2.格式

file

[options]文件名

3.[options]主要參數

-v:在標準輸出後顯示版本信息,並且退出。

-z:探測壓縮過的文件類型。

-L:允許符合連接。

-f

name:從文件namefile中讀取要分析的文件名列表。

4.簡單說明

使用file命令可以知道某個文件究竟是二進位(ELF格式)的可執行文件,還是Shell Script文件,或者是其它的什麼格式。file能識別的文件類型有目錄、Shell腳本、英文文本、二進位可執行文件、C語言源文件、文本文件、DOS的可執行文件。

5.應用實例

如果我們看到一個沒有尾碼的文件grap,可以使用下麵命令:

$  file grap

grap:English text

此時系統顯示這是一個英文文本文件。需要說明的是,file命令不能探測包括圖形、音頻、視頻等多媒體文件類型。

mkdir

1.作用

mkdir命令的作用是建立名稱為dirname的子目錄,與MS DOS下的md命令類似,它的使用許可權是所有用戶。

2.格式

mkdir

[options]目錄名

3.[options]主要參數

-m,--mode=模式:設定許可權<模式>;,與chmod類似。

-p,--parents:需要時創建上層目錄;如果目錄早已存在,則不當作錯誤。

-v,--verbose:每次創建新目錄都顯示信息。

--version:顯示版本信息後離開。

4.應用實例

在進行目錄創建時可以設置目錄的許可權,此時使用的參數是“-m”。假設要創建的目錄名是“tsk”,讓所有用戶都有rwx(即讀、寫、執行的許可權),那麼可以使用以下命令:

$

mkdir-m 777 tsk

grep

1.作用

grep命令可以指定文件中搜索特定的內容,並將含有這些內容的行標準輸出。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用許可權是所有用戶。

2.格式

grep  [options]

3.主要參數

[options]主要參數:

-c:只輸出匹配行的計數。

-I:不區分大小寫(只適用於單字元)。

-h:查詢多文件時不顯示文件名。

-l:查詢多文件時只輸出包含匹配字元的文件名。

-n:顯示匹配行及行號。

-s:不顯示不存在或無匹配文本的錯誤信息。

-v:顯示不包含匹配文本的所有行。

pattern正則表達式主要參數:

\:忽略正則表達式中特殊字元的原有含義。

^:匹配正則表達式的開始行。

$:匹配正則表達式的結束行。

\<:從匹配正則表達式的行開始。

\>;:到匹配正則表達式的行結束。

[

]:單個字元,如[A]即A符合要求 。

[

- ]:範圍,如[A-Z],即A、B、C一直到Z都符合要求 。

。:所有的單個字元。

*:有字元,長度可以為0。

正則表達式是Linux/Unix系統中非常重要的概念。正則表達式(也稱為“regex”或“regexp”)是一個可以描述一類字元串的模式(Pattern)。如果一個字元串可以用某個正則表達式來描述,我們就說這個字元和該正則表達式匹配(Match)。這和DOS中用戶可以使用通配符“*”代表任意字元類似。在Linux系統上,正則表達式通常被用來查找文本的模式,以及對文本執行“搜索-替換”操作和其它功能。

4.應用實例

查詢DNS服務是日常工作之一,這意味著要維護覆蓋不同網路的大量IP地址。有時IP地址會超過2000個。如果要查看nnn.nnn網路地址,但是卻忘了第二部分中的其餘部分,只知到有兩個句點,例如nnn nn..。要抽取其中所有nnn.nnn IP地址,使用[0-9 ]\{3 \}\.[0-0\{3\}\。含義是任意數字出現3次,後跟句點,接著是任意數字出現3次,後跟句點。

$grep

'[0-9 ]\{3 \}\.[0-0\{3\}\' ipfile

補充說明,grep家族還包括fgrep和egrep。fgrep是fix grep,允許查找字元串而不是一個模式;egrep是擴展grep,支持基本及擴展的正則表達式,但不支持\q模式範圍的應用及與之相對應的一些更加規範的模式。

dd

1.作用

dd命令用來複制文件,並根據參數將數據轉換和格式化。

2.格式

dd  [options]

3.[opitions]主要參數

bs=位元組:強迫ibs=<位元組>;及obs=<位元組>;。

cbs=位元組:每次轉換指定的<位元組>;。

conv=關鍵字:根據以逗號分隔的關鍵字表示的方式來轉換文件。

count=塊數目:只複製指定<塊數目>;的輸入數據。

ibs=位元組:每次讀取指定的<位元組>;。

if=文件:讀取<文件>;內容,而非標準輸入的數據。

obs=位元組:每次寫入指定的<位元組>;。

of=文件:將數據寫入<文件>;,而不在標準輸出顯示。

seek=塊數目:先略過以obs為單位的指定<塊數目>;的輸出數據。

skip=塊數目:先略過以ibs為單位的指定<塊數目>;的輸入數據。

4.應用實例

dd命令常常用來製作Linux啟動盤。先找一個可引導內核,令它的根設備指向正確的根分區,然後使用dd命令將其寫入軟盤:

$  rdev vmlinuz /dev/hda

$dd

if=vmlinuz of=/dev/fd0

上面代碼說明,使用rdev命令將可引導內核vmlinuz中的根設備指向/dev/hda,請把“hda”換成自己的根分區,接下來用dd命令將該內核寫入軟盤。

find

1.作用

find命令的作用是在目錄中搜索文件,它的使用許可權是所有用戶。

2.格式

find  [path][options][expression]

path指定目錄路徑,系統從這裡開始沿著目錄樹向下查找文件。它是一個路徑列表,相互用空格分離,如果不寫path,那麼預設為當前目錄。

3.主要參數

[options]參數:

-depth:使用深度級別的查找過程方式,在某層指定目錄中優先查找文件內容。

-maxdepth levels:表示至多查找到開始目錄的第level層子目錄。level是一個非負數,如果level是0的話表示僅在當前目錄中查找。

-mindepth levels:表示至少查找到開始目錄的第level層子目錄。

-mount:不在其它文件系統(如Msdos、Vfat等)的目錄和文件中查找。

-version:列印版本。

[expression]是匹配表達式,是find命令接受的表達式,find命令的所有操作都是針對錶達式的。它的參數非常多,這裡只介紹一些常用的參數。

—name:支持統配符*和?。

-atime n:搜索在過去n天讀取過的文件。

-ctime n:搜索在過去n天修改過的文件。

-group grpoupname:搜索所有組為grpoupname的文件。

-user用戶名:搜索所有文件屬主為用戶名(ID或名稱)的文件。

-size n:搜索文件大小是n個block的文件。

-print:輸出搜索結果,並且列印。

4.應用技巧

find命令查找文件的幾種方法:

(1)根據文件名查找

例如,我們想要查找一個文件名是lilo.conf的文件,可以使用如下命令:

find

/-name lilo.conf

find命令後的“/”表示搜索整個硬碟。

(2)快速查找文件

根據文件名查找文件會遇到一個實際問題,就是要花費相當長的一段時間,特別是大型Linux文件系統和大容量硬碟文件放在很深的子目錄中時。如果我們知道了這個文件存放在某個目錄中,那麼只要在這個目錄中往下尋找就能節省很多時間。比如smb.conf文件,從它的文件尾碼“.conf”可以判斷這是一個配置文件,那麼它應該在/etc目錄內,此時可以使用下麵命令:

find

/etc-name smb.conf

這樣,使用“快速查找文件”方式可以縮短時間。

(3)根據部分文件名查找方法

有時我們知道只某個文件包含有abvd這4個字,那麼要查找系統中所有包含有這4個字元的文件可以輸入下麵命令:

find

/-name '*abvd*'

輸入這個命令以後,Linux系統會將在/目錄中查找所有的包含有abvd這4個字元的文件(其中*是通配符),比如abvdrmyz等符合條件的文件都能顯示出來。

(4)使用混合查找方式查找文件

find命令可以使用混合查找的方法,例如,我們想在/etc目錄中查找大於500000位元組,並且在24小時內修改的某個文件,則可以使用-and (與)把兩個查找參數鏈接起來組合成一個混合的查找方式。

find  /etc -size +500000c -and -mtime +1

mv

1.作用

mv命令用來為文件或目錄改名,或者將文件由一個目錄移入另一個目錄中,它的使用許可權是所有用戶。該命令如同DOS命令中的ren和move的組合。

2.格式

mv[options]源文件或目錄 目標文件或目錄

3.[options]主要參數

-i:交互方式操作。如果mv操作將導致對已存在的目標文件的覆蓋,此時系統詢問是否重寫,要求用戶回答“y”或“n”,這樣可以避免誤覆蓋文件。

-f:禁止交互操作。mv操作要覆蓋某個已有的目標文件時不給任何指示,指定此參數後i參數將不再起作用。

4.應用實例

(1)將/usr/cbu中的所有文件移到當前目錄(用“.”表示)中:

$  mv /usr/cbu/ * .

(2)將文件cjh.txt重命名為wjz.txt:

$

mv cjh.txt wjz.txt

ls

1.作用

ls命令用於顯示目錄內容,類似DOS下的dir命令,它的使用許可權是所有用戶。

2.格式

ls  [options][filename]

3.options主要參數

-a,--all:不隱藏任何以“.”字元開始的項目。

-A,--almost-all:列出除了“ . ”及“.. ”以外的任何項目。

--author:印出每個文件著作者。

-b,--escape:以八進位溢出序列表示不可列印的字元。

--block-size=大小:塊以指定<大小>;的位元組為單位。

-B,--ignore-backups:不列出任何以~字元結束的項目。

-f:不進行排序,-aU參數生效,-lst參數失效。

-F,--classify:加上文件類型的指示符號(*/=@|其中一個)。

-g:like-l, but do

not list owner。

-G,--no-group:inhibit display of group information。

-i,--inode:列出每個文件的inode號。

-I,--ignore=樣式:不印出任何符合Shell萬用字元<樣式>;的項目。

-k:即--block-size=1K。

-l:使用較長格式列出信息。

-L,--dereference:當顯示符號鏈接的文件信息時,顯示符號鏈接所指示的對象,而並非符號鏈接本身的信息。

-m:所有項目以逗號分隔,並填滿整行行寬。

-n,--numeric-uid-gid:類似-l,但列出UID及GID號。

-N,--literal:列出未經處理的項目名稱,例如不特別處理控制字元。

-p,--file-type:加上文件類型的指示符號(/=@|其中一個)。

-Q,--quote-name:將項目名稱括上雙引號。

-r,--reverse:依相反次序排列。

-R,--recursive:同時列出所有子目錄層。

-s,--size:以塊大小為序。

4.應用舉例

ls命令是Linux系統使用頻率最多的命令,它的參數也是Linux命令中最多的。使用ls命令時會有幾種不同的顏色,其中藍色表示是目錄,綠色表示是可執行文件,紅色表示是壓縮文件,淺藍色表示是鏈接文件,加粗的黑色表示符號鏈接,灰色表示是其它格式文件。ls最常使用的是ls- l,

文件類型開頭是由10個字元構成的字元串。其中第一個字元表示文件類型,它可以是下述類型之一:-(普通文件)、d(目錄)、l(符號鏈接)、b(塊設備文件)、c(字元設備文件)。後面的9個字元表示文件的訪問許可權,分為3組,每組3位。第一組表示文件屬主的許可權,第二組表示同組用戶的許可權,第三組表示其他用戶的許可權。每一組的三個字元分別表示對文件的讀(r)、寫(w)和執行許可權(x)。對於目錄,表示進入許可權。s表示當文件被執行時,把該文件的UID或GID賦予執行進程的UID(用戶ID)或GID(組ID)。t表示設置標誌位(留在記憶體,不被換出)。如果該文件是目錄,那麼在該目錄中的文件只能被超級用戶、目錄擁有者或文件屬主刪除。如果它是可執行文件,那麼在該文件執行後,指向其正文段的指針仍留在記憶體。這樣再次執行它時,系統就能更快地裝入該文件。接著顯示的是文件大小、生成時間、文件或命令名稱。

diff

1.作用

diff命令用於兩個文件之間的比較,並指出兩者的不同,它的使用許可權是所有用戶。

2.格式

diff

[options]源文件 目標文件

3.[options]主要參數

-a:將所有文件當作文本文件來處理。

-b:忽略空格造成的不同。

-B:忽略空行造成的不同。

-c:使用綱要輸出格式。

-H:利用試探法加速對大文件的搜索。

-I:忽略大小寫的變化。

-n

--rcs:輸出RCS格式。

cmp

1.作用

cmp(“compare”的縮寫)命令用來簡要指出兩個文件是否存在差異,它的使用許可權是所有用戶。

2.格式

cmp[options]文件名

3.[options]主要參數

-l:將位元組以十進位的方式輸出,並方便將兩個文件中不同的以八進位的方式輸出。

cat

1.作用

cat(“concatenate”的縮寫)命令用於連接並顯示指定的一個和多個文件的有關信息,它的使用許可權是所有用戶。

2.格式

cat

[options]文件1文件2……

3.[options]主要參數

-n:由第一行開始對所有輸出的行數編號。

-b:和-n相似,只不過對於空白行不編號。

-s:當遇到有連續兩行以上的空白行時,就代換為一行的空白行。

4.應用舉例

(1)cat命令一個最簡單的用處是顯示文本文件的內容。例如,我們想在命令行看一下README文件的內容,可以使用命令:

$

cat README

(2)有時需要將幾個文件處理成一個文件,並將這種處理的結果保存到一個單獨的輸出文件。cat命令在其輸入上接受一個或多個文件,並將它們作為一個單獨的文件列印到它的輸出。例如,把README和INSTALL的文件內容加上行號(空白行不加)之後,將內容附加到一個新文本文件File1中:

$  cat README INSTALL File1

(3)cat還有一個重要的功能就是可以對行進行編號,見圖2所示。這種功能對於程式文檔的編製,以及法律和科學文檔的編製很方便,列印在左邊的行號使得參考文檔的某一部分變得容易,這些在編程、科學研究、業務報告甚至是立法工作中都是非常重要的。

圖2使用cat命令/etc/named.conf文件進行編號

對行進行編號功能有-b(只能對非空白行進行編號)和-n(可以對所有行進行編號)兩個參數:

$  cat -b /etc/named.conf

ln

1.作用

ln命令用來在文件之間創建鏈接,它的使用許可權是所有用戶。

2.格式

ln

[options]源文件[鏈接名]

3.參數

-f:鏈結時先將源文件刪除。

-d:允許系統管理者硬鏈結自己的目錄。

-s:進行軟鏈結(Symbolic Link)。

-b:將在鏈結時會被覆蓋或刪除的文件進行備份。

鏈接有兩種,一種被稱為硬鏈接(Hard Link),另一種被稱為符號鏈接(Symbolic Link)。預設情況下,ln命令產生硬鏈接。

硬連接指通過索引節點來進行的連接。在Linux的文件系統中,保存在磁碟分區中的文件不管是什麼類型都給它分配一個編號,稱為索引節點號(Inode Index)。在Linux中,多個文件名指向同一索引節點是存在的。一般這種連接就是硬連接。硬連接的作用是允許一個文件擁有多個有效路徑名,這樣用戶就可以建立硬連接到重要文件,以防止“誤刪”的功能。其原因如上所述,因為對應該目錄的索引節點有一個以上的連接。只刪除一個連接並不影響索引節點本身和其它的連接,只有當最後一個連接被刪除後,文件的數據塊及目錄的連接才會被釋放。也就是說,文件才會被真正刪除。

與硬連接相對應,Lnux系統中還存在另一種連接,稱為符號連接(Symbilc Link),也叫軟連接。軟鏈接文件有點類似於Windows的快捷方式。它實際上是特殊文件的一種。在符號連接中,文件實際上是一個文本文件,其中包含的有另一文件的位置信息。

練習

上面我們介紹了Linux文件處理命令,下麵介紹幾個實例,大家可以動手練習一下剛纔講過的命令。

1.利用符號鏈接快速訪問關鍵目錄

符號鏈接是一個非常實用的功能。假設有一些目錄或文件需要頻繁使用,但由於Linux的文件和目錄結構等原因,這個文件或目錄在很深的子目錄中。比如,Apache

Web伺服器文檔位於系統的/usr/local/httpd/htdocs中,並且不想每次都要從主目錄進入這樣一個長的路徑之中(實際上,這個路徑也非常不容易記憶)。

為瞭解決這個問題,可以在主目錄中創建一個符號鏈接,這樣在需要進入該目錄時,只需進入這個鏈接即可。

為了能方便地進入Web伺服器(/usr/local/httpd/htdocs)文檔所在的目錄,在主目錄下可以使用以下命令:

$  ln -s /usr/local/httpd/htdocs gg

這樣每次進入gg目錄就可訪問Web伺服器的文檔,以後如果不再訪問Web伺服器的文檔時,刪除gg即可,而真正的Web伺服器的文檔並沒有刪除。

2.使用dd命令將init.rd格式的root.ram內容導入記憶體

dd  if=/dev/fd0 of=floppy.fd

dd  if=root.ram of=/dev/ram0 #

3.grep命令系統調用

grep是Linux/Unix中使用最廣泛的命令之一,許多Linux系統內部都可以調用它。

(1)如果要查詢目錄列表中的目錄,方法如下:

$  ls -l | grep '∧d'

(2)如果在一個目錄中查詢不包含目錄的所有文件,方法如下:

$  ls -l | grep '∧[∧d]'

(3)用find命令調用grep,如所有C源代碼中的“Chinput”,方法如下:

$find  /ZhXwin -name *.c -exec grep -q -s Chinput {} \;-print

點擊學習更多Linux入門知識


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 哪位大神能給點意見嗎? ...
  • 硬體工具: Win10安裝(已經裝好Win10的小朋友們請無視): 準備工作: 下載Win10升級助手 安裝步驟(由於安裝過程中未記錄過程,因此僅用文字敘述要點): 選擇要安裝的版本 (推薦:簡體中文-Windows 10-簡體中文 這裡Windows 10其實就是專業版,要裝其他版本可以在選項中選 ...
  • 1、df命令用於查看Linux伺服器的文件系統磁碟的儲存情況,可用該命令獲取磁碟占用多少空間,還剩餘多少空間。 2、du:顯示每個文件和目錄的磁碟使用空間 3、du,df的區別 du,disk usage,是通過搜索文件來計算每個文件的大小然後累加,du能看到的文件只是一些當前存在的,沒有被刪除的。 ...
  • 一般察看函數運行時堆棧的方法是使用GDB(bt命令)之類的外部調試器,但是,有些時候為了分析程式的BUG,(主要針對長時間運行程式的分析),在程式出錯時列印出函數的調用堆棧是非常有用的。 在glibc頭文件"execinfo.h"中聲明瞭三個函數用於獲取當前線程的函數調用堆棧。 int backtr ...
  • Linux小知識分享(一) 標簽(空格分隔): 陳思齊 1,多進程與多線程 1.1 什麼是進程? 程式並不能單獨運行,只有將程式裝載到記憶體中,系統為它分配資源才能運行,而這種承載程式運行的資源池(指令集合)就稱之為進程。 1.2什麼是多進程? 在多道編程中,我們允許多個程式同時載入到記憶體中,在操作系 ...
  • 第十二節 linux三劍客之sed命令精講 標簽(空格分隔): Linux實戰教學筆記 陳思齊 [更多資料點我查看][1] 1,前言 我們都知道,在Linux中一切皆文件,比如配置文件,日誌文件,啟動文件等等。如果我們相對這些文件進行一些編輯查詢等操作時,我們可能會想到一些vi,vim,cat,mo ...
  • 僅供參考…… 測試使用環境:Tplink & Tenda渣渣路由器。其他環境或不同。 設置註意事項:副路由器網段設置和主路由一致。主路由不需要開啟WDS、副路由器開啟WDS(連接ok,狀態即顯示"成功")、主副路由通道需要保持一致(手動設置)、DHCP服務開啟(設置網關) IP地址池設置不妥時,一臺 ...
  • 打開終端,輸入su root,進入root賬戶 在/boot/grub2/下麵有個grub.cfg文件 在命令行輸入vim /boot/grub2/grub.cfg 在### BEGIN /etc/grub.d/10_linux ### 後面加上一段 menuentry 'Windows7'{ in ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...