@(文本處理三劍客) 劍仙鎮樓~ O(∩_∩)O 前言 上一篇中已經預告,我們這篇主要說Linux文本處理三劍客。他們分別是grep、sed、awk 。既然能被業界稱為三劍客,可見其在Linux命令中占有舉足輕重得地位。所以呢,這裡也專門寫一篇文章說一說其用法。 正則表達式 三劍客一般會配合著正則表 ...
@
目錄劍仙鎮樓~ O(∩_∩)O
前言
上一篇中已經預告,我們這篇主要說Linux文本處理三劍客。他們分別是grep、sed、awk 。既然能被業界稱為三劍客,可見其在Linux命令中占有舉足輕重得地位。所以呢,這裡也專門寫一篇文章說一說其用法。
正則表達式
三劍客一般會配合著正則表達式一起使用,為了更好的掌握三劍客,這裡簡單介紹下正則表達式的使用。
正則表達式是由普通字元(例如字元 a 到 z)以及特殊字元(稱為"元字元")組成。在搜索文本時,與要搜索的字元串進行匹配
舉個慄子
*.txt # 表示任意以.txt結尾的文件
這裡就不列出所有的了,我們只把常用的拿出來
1、特殊字元
註:如果需要匹配一下字元,需要在字元前加\進行轉義
特殊字元 | 特殊字元說明 | 例子 |
---|---|---|
\(** | 匹配字元串的結尾位置 | **x\)匹配以"x"結尾的字元串 | ||
^ | 匹配字元串的開頭位置 | ^abc 匹配以"abc"開頭的字元串 |
. | 匹配任意一個字元,除了換行符外 | |
***** | 匹配前面的0次或多次的子表達式 | |
+ | 匹配前面字元有 1 個或多個 | |
.* | 匹配任意一個字元有 0 個或多個,也就是能匹配任意的字元 | |
{} | 匹配前面字元的數量範圍 | {2}表示重覆兩次,{2,}表示至少重覆兩次,{2-4} 重覆2-4次 |
[] | 括弧中可以包含表示字元集的表達式 | [外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Cgsing2y-1650173645257)(快速上手Linux核心命令(五):文本處理三劍客/1649470939258a-z-1649470958893.png)] |
2、非列印字元
字元 | 字元說明 |
---|---|
\f | 匹配一個換頁符 |
\n | 匹配一個換行符 |
\r | 匹配一個回車符 |
\t | 匹配一個製表符 |
\s | 配任何空白字元,包括空格、製表符、換頁符 |
\S | 匹配任何非空白字元 |
第一劍客 grep
1、簡介
grep:文本過濾工具。 用於查找文件里符合條件的字元串,一般配合正則表達式一起使用。
grep 只支持匹配而不能替換匹配的內容,替換的功能可以由 sed 來完成。
2、語法格式
grep [參數選項] [匹配模式][查找得文件]
上面說的匹配模式就是你需要找得東西,可以是普通文字元號,也可以是正則表達式。
3、參數說明
參數 | 參數說明 |
---|---|
-A | 除了顯示匹配內容行之外,還顯示該行之後的N行 |
-B | 除了顯示匹配內容行之外,還顯示該行之前的N行 |
-C | 除了顯示匹配內容行之外,還顯示該行之前後的N行 |
-c | 統計匹配的行數 |
-e | 實現多個選項間的邏輯 or 關係 |
-E | 支持擴展的正則表達式 |
-i | 忽略大小寫 |
-n | 顯示匹配行和行號 |
-o | 僅顯示匹配到的字元串 |
-q | 不輸出任何信息,腳本中常用 |
-v | 顯示不被匹配到的行或者說排除某些行 |
-w | 顯示匹配整個單詞 |
--color | 為grep過濾的匹配字元串添加顏色,以突出顯示 |
4、實踐操作
後面的示例都是以操作下麵文本為例
# 下麵是我們演示所使用的文本文件
[root@xiezhr test]# cat xiezhr.txt
90後,畢業於某不知名本科院校,通信工程專業
目前從事IT類工作,工作生活於春城昆明
天天被各種奇葩業務折騰得死去活來,但依然保有對各項技術熱忱得追求和美好生活得嚮往
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
把分享變成一種習慣,再小的帆也能遠航
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
歡迎您的關註!
① 把包含字元串xiezhr的行過濾出來
[root@xiezhr test]# grep "xiezhr" xiezhr.txt
個人博客:www.xiezhrspace.cn
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
② 把以“個人”開頭的行過濾出來或者把cn結尾的行過濾出來
[root@xiezhr test]# grep "^個人" xiezhr.txt
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
[root@xiezhr test]# grep "cn$" xiezhr.txt
個人博客:www.xiezhrspace.cn
③把匹配xie_zhr 的行及後邊的兩行顯示出來
[root@xiezhr test]# grep -A2 "xie_zhr" xiezhr.txt
個人微信號:xie_zhr
把分享變成一種習慣,再小的帆也能遠航
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
④把匹配xie_zhr 的行及前邊的兩行顯示出來
[root@xiezhr test]# grep -B2 "xie_zhr" xiezhr.txt
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
⑤把匹配xie_zhr 的行及前後的兩行顯示出來
[root@xiezhr test]# grep -C2 "xie_zhr" xiezhr.txt
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
把分享變成一種習慣,再小的帆也能遠航
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
⑥ 過濾某個關鍵字,並顯示行號
[root@xiezhr test]# grep -n "xie_zhr" xiezhr.txt
6:個人微信號:xie_zhr
⑦ 過濾不包含某關鍵詞,並輸出行號
[root@xiezhr test]# grep -n -v "xie_zhr" xiezhr.txt
1:90後,畢業於某不知名本科院校,通信工程專業
2:目前從事IT類工作,工作生活於春城昆明
3:天天被各種奇葩業務折騰得死去活來,但依然保有對各項技術熱忱得追求和美好生活得嚮往
4:個人公眾號:XiezhrSpace
5:個人博客:www.xiezhrspace.cn
7:把分享變成一種習慣,再小的帆也能遠航
8:頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
9:歡迎您的關註!
⑧刪除掉空行、和註釋行
- "|" 表示或
- “^$” 表示空行
- “#”表示註釋符號
[root@xiezhr test]# grep -Ev "^$|#" xiezhr.txt
⑨ 同時過濾多個不同字元串,併為過濾的內容添加顏色突出顯示
[root@xiezhr test]# grep -e "xie" -e "cn" --color=auto xiezhr.txt
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
## 上面等同於
[root@xiezhr test]# grep -E "xie|cn" --color=auto xiezhr.txt
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
⑩ 過濾字元串xiezhr 不區分大小寫
[root@xiezhr test]# grep -i "xiezhr" xiezhr.txt
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
⑪ 計算匹配字元串的數量
[root@xiezhr test]# grep -c "xie" xiezhr.txt
3
第二劍客 sed
1、簡介
sed 是 stream editor 的縮寫,簡稱流編輯器。
是操作、轉換和過濾文本內容的強大工具。可以快速對文本進行增刪改查,過濾(過濾指定字元串)、取行(取出指定行)是查詢功能中最常用的。
2、語法格式
sed [參數選項] [sed內置命令字元][輸入文件]
- sed內置命令字元:可以是單個命令,也可以是多個命令參數的組合
- 輸入文件:sed需要處理的文件,可選項,sed還可以從標準輸入(如管道)中獲取輸入
3、工作原理
為了更好理解sed,這裡說一說sed工作模式
Sed是從文件或管道中讀取一行,處理一行,輸出一行;再讀取一行,再處理一行,再輸出一行,直到最後一行。每當處理一行時,把當前處理的行存儲在臨時緩衝區中,稱為模式空間(Pattern Space),接著用sed命令處理緩衝區中的內容,處理完成後,把緩衝區的內容送往屏幕。接著處理下一行,這樣不斷重覆,直到文件末尾
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-pF5tKJm0-1650173645258)(快速上手Linux核心命令(五):文本處理三劍客/16493443873561649344386938-1649344431717.png)]
4、參數說明
命令參數
參數 | 參數說明 |
---|---|
-n | 取消預設的sed輸出,常與sed內置命令p連用 |
-i | 直接修改文件內容,而不是輸出到終端。如果不使用-i參數,sed只是修改記憶體中的內容,不會影響磁碟上的實際文件 |
常用內置命令字元
解釋說明 | sed內置命令字元 |
---|---|
a | append,表示追加文本,在指定行後添加一行或多行文本 |
d | delete,表示刪除匹配行文本 |
i | insert,表示插入文本,在指定行前添加一行或多行文本 |
p | print,表示列印匹配行的內容,通常與-n參數一起使用 |
s/regexp/replacestr | replace ,表示可以用replacestr(可以是特殊字元&、$等)字元串,替換正則表達式regexp所匹配的內容 |
4、實踐操作
這個是我們要操作的文本哈
[root@xiezhr test]# cat file.txt
blog:www.xiezhrspace.cn
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
① 替換子命令s
基本用法
# 1.將文本中"xiezhrspace"字元串替換成“xiezhr”
[root@xiezhr test]# sed 's/xiezhrspace/xiezhr/' file.txt
blog:www.xiezhr.cn
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
# 2 在每行行首加上“#”
[root@xiezhr test]# sed 's/^/#/g' file.txt
#blog:www.xiezhrspace.cn
#email:[email protected]
#QQ:2544458199
#img:/xiezhr.png
#age:18
#professional:Software engineer
# 3.在每行行尾加上“*”
[root@xiezhr test]# sed 's/$/ */g' file.txt
blog:www.xiezhrspace.cn *
email:[email protected] *
QQ:2544458199 *
img:/xiezhr.png *
age:18 *
professional:Software engineer *
帶正則表達式的使用
# 將所有的數字替換成“*”
[root@xiezhr test]# sed 's/[0-9]/*/g' file.txt
blog:www.xiezhrspace.cn
email:**********@qq.com
QQ:**********
img:/xiezhr.png
age:**
professional:Software engineer
多個匹配
# 將1-3行 1替換成2;3到結尾行數字替換成“*”
[root@xiezhr test]# sed '1,3s/1/2/g; 3,$s/[0-9]/*/g' file.txt
blog:www.xiezhrspace.cn
email:[email protected]
QQ:**********
img:/xiezhr.png
age:**
professional:Software engineer
其他用法
# 將替換後的內容寫入到新的文件中
[root@xiezhr test]# sed 's/QQ/qq/w file1.txt' file.txt
blog:www.xiezhrspace.cn
email:[email protected]
qq:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
[root@xiezhr test]# cat file1.txt
qq:2544458199
**註意: sed 修改匹配到的內容後,預設行為是不保存到原文件,直接輸出修改後模式空間的內容,如果要修改原文件需要指定 -i
選項 **
② 追加行子命令a
# 1.將所有行下麵都追加“-----------------------------------”
[root@xiezhr test]# sed 'a -----------------------------------' file.txt
blog:www.xiezhrspace.cn
-----------------------------------
email:[email protected]
-----------------------------------
QQ:2544458199
-----------------------------------
img:/xiezhr.png
-----------------------------------
age:18
-----------------------------------
professional:Software engineer
-----------------------------------
# 2.將1-2 行後面追加一行“************************************”
[root@xiezhr test]# sed '1,2a ******************************' file.txt
blog:www.xiezhrspace.cn
******************************
email:[email protected]
******************************
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
③ 插入行子命令i
# 在1-2行前面插入一行“******************************”
[root@xiezhr test]# sed '1,2i ******************************' file.txt
******************************
blog:www.xiezhrspace.cn
******************************
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
④ 刪除行子命令d
#1.將文中1-2行刪除
[root@xiezhr test]# sed '1,2d' file.txt
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
#2.刪除文件中所有的數字
[root@xiezhr test]# sed 's/[0-9]//g' file.txt
blog:www.xiezhrspace.cn
email:@qq.com
QQ:
img:/xiezhr.png
age:
professional:Software engineer
# 3.刪除所有空白行
[root@xiezhr test]# sed '/^$/d' file.txt
blog:www.xiezhrspace.cn
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
⑥ 列印指定行子命令
# 列印file 第二行內容(這裡如果不加參數“-n”的話,列印出來的不僅僅是第二行,這個是為什麼呢? 這是因為sed有個預設輸出功能,我們需要把預設輸出取消掉,所以帶上了-n參數)
# -n p 可以理解為一隊cp,p出現了一般都會用-n參數
[root@xiezhr test]# sed -n '2p' file.txt
email:[email protected]
# 列印2-3行內容
[root@xiezhr test]# sed -n '2,3p' file.txt
email:[email protected]
QQ:2544458199
第三 劍客 awk
1、簡介
awk 是Linux中最強大的工具,沒有之一哈(●'◡'●)。本來不想說的,怕嚇到你。其實awk 還是一種編程語言哦。
awk可以用來處理數據和生成報告,處理的數據可以是一個或多個文件。
那麼,awk具體能幹些啥呢?
序號 | 功能 |
---|---|
1 | 能夠將給定的文本內容,按照我們期望的格式輸出,列印成報表 |
2 | 分析系統日誌,快速分析挖掘出我們關心的數據,並生成統計信息 |
3 | 很方便的統計數據,常用於網站訪問量、訪問IP統計等 |
4 | 參與數組計算與去重 |
5 | 顯示出某個範圍內的內容 |
2、語法格式
grep [參數選項] [條件動作][文件]
3、工作原理
為了能更好的掌握awk這一劍法,我們有必要瞭解下其原理。
結合上圖,執行流程如下
- 首先 ,執行關鍵字BEGIN塊的內容,即BEGIN後花括弧{}里的命令;
- 完成 BEGIN 塊的執行,開始執行BODY塊;
- 逐行讀取數據,預設讀到 \n 分割的內容為一條 記錄,也就是所謂的行;
- 將記錄按照指定的分隔符劃分為 欄位,也就是列 ;$0 則表示所有域(即一行內容),\(1** 表示第一列,**\)n 表示第 n 列;
- 迴圈執行BODY塊中的命令,每讀取一行,執行一次BODY塊命令,直到數據的最後一行處理完為止;
- 最後執行END塊命令,END塊一般輸出最終結果
BEGIN(開始塊)
語法格式
BEGIN {awk-commands}
開始塊就是在程式啟動的時候執行的代碼部分,並且它在整個過程中只**執行一次 **
一般情況下,我們會在開始塊中 **初始化一些變數 **;
註: 開始塊部分是可選的,可以有也可以沒有。BEGIN是關鍵字,必須要大寫
BODY(主體塊)
語法格式
/pattern/ {awk-commands}
每一個輸入的行都會執行一次主體部分的命令
註: 在主體塊部分沒有關鍵字存在
END(結束塊)
語法格式
END {awk-commands}
註:結束塊是在程式結束時執行的代碼。 END 也是 AWK 的關鍵字,它也必須大寫。 與開始塊相似,結束塊也是可選的。
以上可以簡單總結為:記錄 (Record) 就是行,欄位 (Field) 就是列,BEGIN
是預處理階段,body
是 awk 真正工作的階段,END
是最後處理階段。
4、參數說明
參數 | 參數說明 |
---|---|
-F | 指定欄位分隔符 |
-v | 定義或修改一個awk內部的變數 |
5、內置變數
每一行是一條記錄(Record),通過分隔符分割的每一列是一個欄位(Field)
NR
: 表示當前的行數;NF
: 表示當前的列數;RS
: 行分隔符,預設是換行;FS
: 列分隔符,預設是空格和製表符;OFS
: 輸出列分隔符,用於列印時分割欄位,預設為空格ORS
: 輸出行分隔符,用於列印時分割記錄,預設為換行符
6、常用函數
awk 內藏了大量功能強大且有用的函數,當然了,你也可以定義自己的函數
函數 | 函數功能 |
---|---|
gsub(r, s, t) |
指定的目標範圍(t)內,用r替換s;t省略時,預設為$0作為參數,即整行文本 |
index(s, t) |
返回子串 t 在 s 中的位置 |
length(s) |
返回s的長度 |
split(s,a,fs) |
分割字元串,並將分割後的各欄位存放在數組 a 中 |
substr(s, p, n) |
截取字元串。sub(r,s) 用$0中最左邊最長的子串代替s;substr(s,p) 返回字元串s中從p開始到最後的字元串;substr(s,p,n) 返回字元串s中從p開始長度為n的字元串 |
tolower(s) |
將字元串s轉換為小寫 |
toupper(s) |
將字元串轉換為大寫 |
7、輸出格式
awk 提供
printf
函數進行格式化輸出功能
語法格式(如果你學過C語言,那麼這個你應該很熟悉了)
printf("%12s,%02d,%0.2f\n",s,d,g);
常用的格式化方式:
%d
十進位有符號整數%u
十進位無符號整數%f
浮點數%s
字元串%c
單個字元%e
指數形式的浮點數%x
%X
無符號以十六進位表示的整數%0
無符號以八進位表示的整數%g
自動選擇合適的表示法\n
換行符\t
Tab符
上面我們悄悄的提到awk也是一種編程語言,相信你還沒有忘記吧。不信的話你回頭看看(●'◡'●)
既然是編程語言,那麼它肯定是支持 條件語句、迴圈語句、數組、函數等的
8、實踐操作
光說不練假把式,上面說了這麼多其用法。接下來我們就實際操練一番唄
以下操作都是基於myfile.txt 文本來操作的,內容如下
[root@xiezhr test]# cat myfile.txt
-rw-r--r-- 1 root root 44 Mar 26 14:43 a1.txt
-rw-r--r-- 1 root root 65 Mar 26 14:56 a2.txt
-rw-r--r-- 1 root xiezhr 92 Mar 26 15:00 a.txt
-rwxr-xr-x 1 xiezhr xiezhr 0 Mar 14 22:37 c.txt
drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
-rw-r--r-- 1 root root 0 Mar 17 23:03 dir2
drwxr-xr-x 2 root xiezhr 4096 Mar 17 23:03 dir3
drwxr-xr-x 2 root root 4096 Mar 18 20:48 dir5
drwxr-xr-x 2 root root 4096 Mar 18 21:18 dir6
drwxr-xr-x 2 root root 4096 Mar 13 15:27 dir_bak
-rw-r--r-- 1 root root 14 Apr 9 11:23 file1.txt
-rw-r--r-- 1 root root 117 Apr 9 11:04 file.txt
-rw-r--r-- 1 root root 132 Mar 17 00:18 movie.tar.gz
-rw-r--r-- 1 root root 15 Mar 26 10:41 m.tx
-rw-r--r-- 1 root root 0 Apr 17 10:27 myfile.txt
-rw-r--r-- 1 root root 192 Mar 26 14:28 test1.txt
-rw-r--r-- 1 root root 6 Mar 26 10:05 test2.txt
-rw-r--r-- 1 root root 10 Mar 26 10:24 test3.txt
-rw-r--r-- 1 root root 44 Mar 17 22:27 test.txt
-rw-r--r-- 1 root root 0 Mar 11 22:52 tt.txt
-rw-r--r-- 1 root root 31 Mar 26 21:08 xaa
-rw-r--r-- 1 root root 45 Mar 26 21:08 xab
-rw-r--r-- 1 root root 16 Mar 26 21:08 xac
-rw-r--r-- 1 root root 527 Apr 9 10:55 xiezhr.txt
① 顯示文件中第3行
[root@xiezhr test]# awk 'NR==3' myfile.txt
-rw-r--r-- 1 root xiezhr 92 Mar 26 15:00 a.txt
NR在上面已經提到過了,表示行號。NR==3 表示第三行。==表示等於,=表示賦值,這裡別寫錯了哈。
② 顯示3到5行
[root@xiezhr test]# awk 'NR==3,NR==5' myfile.txt
-rw-r--r-- 1 root xiezhr 92 Mar 26 15:00 a.txt
-rwxr-xr-x 1 xiezhr xiezhr 0 Mar 14 22:37 c.txt
drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
③ 顯示輸出文件中的1、3、5 列
[root@xiezhr test]# awk '{print $1,$3,$5}' myfile.txt
-rw-r--r-- root 44
-rw-r--r-- root 65
-rw-r--r-- root 92
-rwxr-xr-x xiezhr 0
drwxr-xr-x xiezhr 4096
-rw-r--r-- root 0
drwxr-xr-x root 4096
drwxr-xr-x root 4096
drwxr-xr-x root 4096
drwxr-xr-x root 4096
-rw-r--r-- root 14
-rw-r--r-- root 117
-rw-r--r-- root 132
-rw-r--r-- root 15
-rw-r--r-- root 0
-rw-r--r-- root 192
-rw-r--r-- root 6
-rw-r--r-- root 10
-rw-r--r-- root 44
-rw-r--r-- root 0
-rw-r--r-- root 31
-rw-r--r-- root 45
-rw-r--r-- root 16
-rw-r--r-- root 527
還有一種寫法,這次我們來列印1、3和最後一列(之所以要列印最後一列,是因為我們要引入新的知識點O(∩_∩)O)
[root@xiezhr test]# awk -F " " '{print $1,$2,$NF}' myfile.txt
-rw-r--r-- 1 a1.txt
-rw-r--r-- 1 a2.txt
-rw-r--r-- 1 a.txt
-rwxr-xr-x 1 c.txt
drwxr-xr-x 2 dir
-rw-r--r-- 1 dir2
drwxr-xr-x 2 dir3
drwxr-xr-x 2 dir5
drwxr-xr-x 2 dir6
drwxr-xr-x 2 dir_bak
-rw-r--r-- 1 file1.txt
-rw-r--r-- 1 file.txt
-rw-r--r-- 1 movie.tar.gz
-rw-r--r-- 1 m.tx
-rw-r--r-- 1 myfile.txt
-rw-r--r-- 1 test1.txt
-rw-r--r-- 1 test2.txt
-rw-r--r-- 1 test3.txt
-rw-r--r-- 1 test.txt
-rw-r--r-- 1 tt.txt
-rw-r--r-- 1 xaa
-rw-r--r-- 1 xab
-rw-r--r-- 1 xac
-rw-r--r-- 1 xiezhr.txt
- -F 指定分隔符,F要是大寫哦
- NF表示最後一列,$1 表示第一列,$2 表示第二列,$3表示第三列.......依次類推,但是$0表示一整行
④格式輸出我們想要的內容。
[root@xiezhr test]# awk '{printf "%-4s,%-2s,%-4s\n",$1,$3,$5}' myfile.txt
-rw-r--r--,root,44
-rw-r--r--,root,65
-rw-r--r--,root,92
-rwxr-xr-x,xiezhr,0
drwxr-xr-x,xiezhr,4096
-rw-r--r--,root,0
drwxr-xr-x,root,4096
drwxr-xr-x,root,4096
drwxr-xr-x,root,4096
drwxr-xr-x,root,4096
...
- 學過C語言的你可能已經發現了,這裡的格式輸出跟C語言中printf用法是一樣的
- %s 表示占位符
- -4 表示列寬為4,且左對齊
⑤ 過濾出第四列是xiezhr,第七列是17的記錄
[root@xiezhr test]# awk '$4=="xiezhr" && $7==17 {print $0}' myfile.txt
drwxr-xr-x 2 root xiezhr 4096 Mar 17 23:03 dir3
⑥ 指定"|"分隔符,並列印出來
[root@xiezhr test]# awk '{print $1,"|",$3}' myfile.txt
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rwxr-xr-x | xiezhr
drwxr-xr-x | xiezhr
-rw-r--r-- | root
drwxr-xr-x | root
drwxr-xr-x | root
drwxr-xr-x | root
drwxr-xr-x | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
⑦ 條件(正則表達式)匹配(過濾出xiezhr用戶的所有文件,以及最後一行)
[root@xiezhr test]# awk '$3 ~/xiezhr/ || NR==NF {print NR,$0}' myfile.txt
4 -rwxr-xr-x 1 xiezhr xiezhr 0 Mar 14 22:37 c.txt
5 drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
9 drwxr-xr-x 2 root root 4096 Mar 18 21:18 dir6
⑧ gsub替換內容(我們把文件中的-rw-r--r-- 替換成xiezhrspace)
[root@xiezhr test]# awk '{gsub("-rw-r--r--","xiezhrspace",$0);print $0}' myfile.txt
xiezhrspace 1 root root 44 Mar 26 14:43 a1.txt
xiezhrspace 1 root root 65 Mar 26 14:56 a2.txt
xiezhrspace 1 root xiezhr 92 Mar 26 15:00 a.txt
-rwxr-xr-x 1 xiezhr xiezhr 0 Mar 14 22:37 c.txt
drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
xiezhrspace 1 root root 0 Mar 17 23:03 dir2
drwxr-xr-x 2 root xiezhr 4096 Mar 17 23:03 dir3
drwxr-xr-x 2 root root 4096 Mar 18 20:48 dir5
drwxr-xr-x 2 root root 4096 Mar 18 21:18 dir6
drwxr-xr-x 2 root root 4096 Mar 13 15:27 dir_bak
xiezhrspace 1 root root 14 Apr 9 11:23 file1.txt
xiezhrspace 1 root root 117 Apr 9 11:04 file.txt
xiezhrspace 1 root root 132 Mar 17 00:18 movie.tar.gz
xiezhrspace 1 root root 15 Mar 26 10:41 m.tx
xiezhrspace 1 root root 0 Apr 17 10:27 myfile.txt
xiezhrspace 1 root root 192 Mar 26 14:28 test1.txt
xiezhrspace 1 root root 6 Mar 26 10:05 test2.txt
xiezhrspace 1 root root 10 Mar 26 10:24 test3.txt
xiezhrspace 1 root root 44 Mar 17 22:27 test.txt
xiezhrspace 1 root root 0 Mar 11 22:52 tt.txt
xiezhrspace 1 root root 31 Mar 26 21:08 xaa
xiezhrspace 1 root root 45 Mar 26 21:08 xab
xiezhrspace 1 root root 16 Mar 26 21:08 xac
xiezhrspace 1 root root 527 Apr 9 10:55 xiezhr.txt
- 這裡用了akw 的查找替換功能,即gsub函數,gsub在上面已經具體說過了,如果忘記了可以返回去看看
⑨ if語句(前面說過awk還是一種編程語言,可能你也是半信半疑的,這裡就來演示一下awk的if語句,讓你見識一下,