快速上手Linux核心命令(五):文本處理三劍客

来源:https://www.cnblogs.com/xiezhr/archive/2023/04/25/17343228.html
-Advertisement-
Play Games

@(文本處理三劍客) 劍仙鎮樓~ O(∩_∩)O 前言 上一篇中已經預告,我們這篇主要說Linux文本處理三劍客。他們分別是grep、sed、awk 。既然能被業界稱為三劍客,可見其在Linux命令中占有舉足輕重得地位。所以呢,這裡也專門寫一篇文章說一說其用法。 正則表達式 三劍客一般會配合著正則表 ...


@

目錄

劍仙鎮樓~ O(∩_∩)O
在這裡插入圖片描述

前言

上一篇中已經預告,我們這篇主要說Linux文本處理三劍客。他們分別是grepsedawk 。既然能被業界稱為三劍客,可見其在Linux命令中占有舉足輕重得地位。所以呢,這裡也專門寫一篇文章說一說其用法。

在這裡插入圖片描述

正則表達式

三劍客一般會配合著正則表達式一起使用,為了更好的掌握三劍客,這裡簡單介紹下正則表達式的使用。

正則表達式是由普通字元(例如字元 a 到 z)以及特殊字元(稱為"元字元")組成。在搜索文本時,與要搜索的字元串進行匹配

舉個慄子

*.txt   # 表示任意以.txt結尾的文件

這裡就不列出所有的了,我們只把常用的拿出來

1、特殊字元

註:如果需要匹配一下字元,需要在字元前加\進行轉義

特殊字元 特殊字元說明 例子
\(** | 匹配字元串的結尾位置 | **x\)匹配以"x"結尾的字元串
^ 匹配字元串的開頭位置 ^abc 匹配以"abc"開頭的字元串
. 匹配任意一個字元,除了換行符外
***** 匹配前面的0次或多次的子表達式
+ 匹配前面字元有 1 個或多個
.* 匹配任意一個字元有 0 個或多個,也就是能匹配任意的字元
{} 匹配前面字元的數量範圍 {2}表示重覆兩次,{2,}表示至少重覆兩次,{2-4} 重覆2-4次
[] 括弧中可以包含表示字元集的表達式 [外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Cgsing2y-1650173645257)(快速上手Linux核心命令(五):文本處理三劍客/1649470939258a-z-1649470958893.png)]

2、非列印字元

字元 字元說明
\f 匹配一個換頁符
\n 匹配一個換行符
\r 匹配一個回車符
\t 匹配一個製表符
\s 配任何空白字元,包括空格、製表符、換頁符
\S 匹配任何非空白字元

第一劍客 grep

1、簡介

grep:文本過濾工具。 用於查找文件里符合條件的字元串,一般配合正則表達式一起使用。

grep 只支持匹配而不能替換匹配的內容,替換的功能可以由 sed 來完成。

2、語法格式

grep [參數選項] [匹配模式][查找得文件]

上面說的匹配模式就是你需要找得東西,可以是普通文字元號,也可以是正則表達式。

3、參數說明

參數 參數說明
-A 除了顯示匹配內容行之外,還顯示該行之的N行
-B 除了顯示匹配內容行之外,還顯示該行之的N行
-C 除了顯示匹配內容行之外,還顯示該行之前後的N行
-c 統計匹配的行數
-e 實現多個選項間的邏輯 or 關係
-E 支持擴展的正則表達式
-i 忽略大小寫
-n 顯示匹配行和行號
-o 僅顯示匹配到的字元串
-q 不輸出任何信息,腳本中常用
-v 顯示不被匹配到的行或者說排除某些行
-w 顯示匹配整個單詞
--color 為grep過濾的匹配字元串添加顏色,以突出顯示

4、實踐操作

後面的示例都是以操作下麵文本為例

# 下麵是我們演示所使用的文本文件
[root@xiezhr test]# cat xiezhr.txt 
90後,畢業於某不知名本科院校,通信工程專業
目前從事IT類工作,工作生活於春城昆明
天天被各種奇葩業務折騰得死去活來,但依然保有對各項技術熱忱得追求和美好生活得嚮往
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
把分享變成一種習慣,再小的帆也能遠航
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
歡迎您的關註!

① 把包含字元串xiezhr的行過濾出來

[root@xiezhr test]# grep "xiezhr" xiezhr.txt 
個人博客:www.xiezhrspace.cn
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg

② 把以“個人”開頭的行過濾出來或者把cn結尾的行過濾出來

[root@xiezhr test]# grep "^個人" xiezhr.txt 
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr

[root@xiezhr test]# grep "cn$" xiezhr.txt 
個人博客:www.xiezhrspace.cn

③把匹配xie_zhr 的行及邊的兩行顯示出來

[root@xiezhr test]# grep -A2 "xie_zhr" xiezhr.txt 
個人微信號:xie_zhr
把分享變成一種習慣,再小的帆也能遠航
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg

④把匹配xie_zhr 的行及邊的兩行顯示出來

[root@xiezhr test]# grep -B2 "xie_zhr" xiezhr.txt 
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr

⑤把匹配xie_zhr 的行及前後的兩行顯示出來

[root@xiezhr test]# grep -C2 "xie_zhr" xiezhr.txt 
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
把分享變成一種習慣,再小的帆也能遠航
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg

⑥ 過濾某個關鍵字,並顯示行號

[root@xiezhr test]# grep -n "xie_zhr" xiezhr.txt 
6:個人微信號:xie_zhr

⑦ 過濾不包含某關鍵詞,並輸出行號

[root@xiezhr test]# grep -n -v "xie_zhr" xiezhr.txt 
1:90後,畢業於某不知名本科院校,通信工程專業
2:目前從事IT類工作,工作生活於春城昆明
3:天天被各種奇葩業務折騰得死去活來,但依然保有對各項技術熱忱得追求和美好生活得嚮往
4:個人公眾號:XiezhrSpace
5:個人博客:www.xiezhrspace.cn
7:把分享變成一種習慣,再小的帆也能遠航
8:頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
9:歡迎您的關註!

⑧刪除掉空行、和註釋行

  • "|" 表示或
  • “^$” 表示空行
  • “#”表示註釋符號
 [root@xiezhr test]# grep -Ev "^$|#" xiezhr.txt

⑨ 同時過濾多個不同字元串,併為過濾的內容添加顏色突出顯示

[root@xiezhr test]# grep -e "xie" -e "cn" --color=auto xiezhr.txt 
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg
## 上面等同於
[root@xiezhr test]# grep -E "xie|cn"  --color=auto xiezhr.txt 
個人博客:www.xiezhrspace.cn
個人微信號:xie_zhr
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg

⑩ 過濾字元串xiezhr 不區分大小寫

[root@xiezhr test]# grep -i "xiezhr" xiezhr.txt 
個人公眾號:XiezhrSpace
個人博客:www.xiezhrspace.cn
頭像連接:https://gitee.com/xiezhr/image-learn-bed/raw/master/image/avatar.jpg

⑪ 計算匹配字元串的數量

[root@xiezhr test]# grep -c "xie" xiezhr.txt 
3

第二劍客 sed

1、簡介

sed 是 stream editor 的縮寫,簡稱流編輯器。

是操作、轉換和過濾文本內容的強大工具。可以快速對文本進行增刪改查,過濾(過濾指定字元串)、取行(取出指定行)是查詢功能中最常用的。

2、語法格式

sed [參數選項] [sed內置命令字元][輸入文件]
  • sed內置命令字元:可以是單個命令,也可以是多個命令參數的組合
  • 輸入文件:sed需要處理的文件,可選項,sed還可以從標準輸入(如管道)中獲取輸入

3、工作原理

為了更好理解sed,這裡說一說sed工作模式

Sed是從文件或管道中讀取一行,處理一行,輸出一行;再讀取一行,再處理一行,再輸出一行,直到最後一行。每當處理一行時,把當前處理的行存儲在臨時緩衝區中,稱為模式空間(Pattern Space),接著用sed命令處理緩衝區中的內容,處理完成後,把緩衝區的內容送往屏幕。接著處理下一行,這樣不斷重覆,直到文件末尾

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-pF5tKJm0-1650173645258)(快速上手Linux核心命令(五):文本處理三劍客/16493443873561649344386938-1649344431717.png)]

4、參數說明

命令參數

參數 參數說明
-n 取消預設的sed輸出,常與sed內置命令p連用
-i 直接修改文件內容,而不是輸出到終端。如果不使用-i參數,sed只是修改記憶體中的內容,不會影響磁碟上的實際文件

常用內置命令字元

解釋說明 sed內置命令字元
a append,表示追加文本,在指定行後添加一行或多行文本
d delete,表示刪除匹配行文本
i insert,表示插入文本,在指定行前添加一行或多行文本
p print,表示列印匹配行的內容,通常與-n參數一起使用
s/regexp/replacestr replace ,表示可以用replacestr(可以是特殊字元&、$等)字元串,替換正則表達式regexp所匹配的內容

4、實踐操作

這個是我們要操作的文本哈

[root@xiezhr test]# cat file.txt 
blog:www.xiezhrspace.cn 
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer

① 替換子命令s

基本用法

# 1.將文本中"xiezhrspace"字元串替換成“xiezhr”
[root@xiezhr test]# sed 's/xiezhrspace/xiezhr/' file.txt 
blog:www.xiezhr.cn 
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
# 2 在每行行首加上“#”
[root@xiezhr test]# sed 's/^/#/g' file.txt
#blog:www.xiezhrspace.cn 
#email:[email protected]
#QQ:2544458199
#img:/xiezhr.png
#age:18
#professional:Software engineer

# 3.在每行行尾加上“*”
[root@xiezhr test]# sed 's/$/ */g' file.txt
blog:www.xiezhrspace.cn  *
email:[email protected] *
QQ:2544458199 *
img:/xiezhr.png *
age:18 *
professional:Software engineer *

帶正則表達式的使用

# 將所有的數字替換成“*”
[root@xiezhr test]# sed 's/[0-9]/*/g' file.txt 
blog:www.xiezhrspace.cn 
email:**********@qq.com
QQ:**********
img:/xiezhr.png
age:**
professional:Software engineer

多個匹配

# 將1-3行 1替換成2;3到結尾行數字替換成“*”
[root@xiezhr test]# sed '1,3s/1/2/g; 3,$s/[0-9]/*/g' file.txt 
blog:www.xiezhrspace.cn 
email:[email protected]
QQ:**********
img:/xiezhr.png
age:**
professional:Software engineer

其他用法

# 將替換後的內容寫入到新的文件中
[root@xiezhr test]# sed 's/QQ/qq/w file1.txt' file.txt 
blog:www.xiezhrspace.cn 
email:[email protected]
qq:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
[root@xiezhr test]# cat file1.txt 
qq:2544458199

**註意: sed 修改匹配到的內容後,預設行為是不保存到原文件,直接輸出修改後模式空間的內容,如果要修改原文件需要指定 -i 選項 **

② 追加行子命令a

# 1.將所有行下麵都追加“-----------------------------------”
[root@xiezhr test]# sed 'a -----------------------------------' file.txt 
blog:www.xiezhrspace.cn 
-----------------------------------
email:[email protected]
-----------------------------------
QQ:2544458199
-----------------------------------
img:/xiezhr.png
-----------------------------------
age:18
-----------------------------------
professional:Software engineer
-----------------------------------

# 2.將1-2 行後面追加一行“************************************”
[root@xiezhr test]# sed '1,2a ******************************' file.txt 
blog:www.xiezhrspace.cn 
******************************
email:[email protected]
******************************
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer

③ 插入行子命令i

# 在1-2行前面插入一行“******************************”
[root@xiezhr test]# sed '1,2i ******************************' file.txt 
******************************
blog:www.xiezhrspace.cn 
******************************
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer

④ 刪除行子命令d

#1.將文中1-2行刪除
[root@xiezhr test]# sed '1,2d' file.txt 
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer
#2.刪除文件中所有的數字
[root@xiezhr test]# sed 's/[0-9]//g' file.txt
blog:www.xiezhrspace.cn 
email:@qq.com
QQ:
img:/xiezhr.png
age:
professional:Software engineer
# 3.刪除所有空白行
[root@xiezhr test]# sed '/^$/d' file.txt
blog:www.xiezhrspace.cn 
email:[email protected]
QQ:2544458199
img:/xiezhr.png
age:18
professional:Software engineer

⑥ 列印指定行子命令

# 列印file 第二行內容(這裡如果不加參數“-n”的話,列印出來的不僅僅是第二行,這個是為什麼呢? 這是因為sed有個預設輸出功能,我們需要把預設輸出取消掉,所以帶上了-n參數)
# -n p 可以理解為一隊cp,p出現了一般都會用-n參數
[root@xiezhr test]# sed -n '2p' file.txt 
email:[email protected]
# 列印2-3行內容
[root@xiezhr test]# sed -n '2,3p' file.txt 
email:[email protected]
QQ:2544458199

第三 劍客 awk

1、簡介

awk 是Linux中最強大的工具,沒有之一哈(●'◡'●)。本來不想說的,怕嚇到你。其實awk 還是一種編程語言哦。

awk可以用來處理數據和生成報告,處理的數據可以是一個或多個文件。

那麼,awk具體能幹些啥呢?

序號 功能
1 能夠將給定的文本內容,按照我們期望的格式輸出,列印成報表
2 分析系統日誌,快速分析挖掘出我們關心的數據,並生成統計信息
3 很方便的統計數據,常用於網站訪問量、訪問IP統計等
4 參與數組計算與去重
5 顯示出某個範圍內的內容

2、語法格式

grep [參數選項] [條件動作][文件]

3、工作原理

為了能更好的掌握awk這一劍法,我們有必要瞭解下其原理。

結合上圖,執行流程如下

  1. 首先 ,執行關鍵字BEGIN塊的內容,即BEGIN後花括弧{}里的命令;
  2. 完成 BEGIN 塊的執行,開始執行BODY塊
  3. 逐行讀取數據,預設讀到 \n 分割的內容為一條 記錄,也就是所謂的
  4. 記錄按照指定的分隔符劃分為 欄位,也就是$0 則表示所有域(即一行內容),\(1** 表示第一列,**\)n 表示第 n 列;
  5. 迴圈執行BODY塊中的命令,每讀取一行,執行一次BODY塊命令,直到數據的最後一行處理完為止;
  6. 最後執行END塊命令,END塊一般輸出最終結果

BEGIN(開始塊)

語法格式

BEGIN {awk-commands}

開始塊就是在程式啟動的時候執行的代碼部分,並且它在整個過程中只**執行一次 **

一般情況下,我們會在開始塊中 **初始化一些變數 **;

註: 開始塊部分是可選的,可以有也可以沒有。BEGIN是關鍵字,必須要大寫

BODY(主體塊)

語法格式

/pattern/ {awk-commands}

每一個輸入的行都會執行一次主體部分的命令

註: 在主體塊部分沒有關鍵字存在

END(結束塊)

語法格式

END {awk-commands}

註:結束塊是在程式結束時執行的代碼。 END 也是 AWK 的關鍵字,它也必須大寫。 與開始塊相似,結束塊也是可選的

以上可以簡單總結為:記錄 (Record) 就是欄位 (Field) 就是BEGIN 是預處理階段,body 是 awk 真正工作的階段,END 是最後處理階段。

4、參數說明

參數 參數說明
-F 指定欄位分隔符
-v 定義或修改一個awk內部的變數

5、內置變數

每一行是一條記錄(Record),通過分隔符分割的每一列是一個欄位(Field)

  • NR: 表示當前的行數;
  • NF: 表示當前的列數;
  • RS : 行分隔符,預設是換行;
  • FS : 列分隔符,預設是空格和製表符;
  • OFS: 輸出列分隔符,用於列印時分割欄位,預設為空格
  • ORS : 輸出行分隔符,用於列印時分割記錄,預設為換行符

6、常用函數

awk 內藏了大量功能強大且有用的函數,當然了,你也可以定義自己的函數

函數 函數功能
gsub(r, s, t) 指定的目標範圍(t)內,用r替換s;t省略時,預設為$0作為參數,即整行文本
index(s, t) 返回子串 t 在 s 中的位置
length(s) 返回s的長度
split(s,a,fs) 分割字元串,並將分割後的各欄位存放在數組 a 中
substr(s, p, n) 截取字元串。sub(r,s) 用$0中最左邊最長的子串代替s;substr(s,p) 返回字元串s中從p開始到最後的字元串;substr(s,p,n) 返回字元串s中從p開始長度為n的字元串
tolower(s) 將字元串s轉換為小寫
toupper(s) 將字元串轉換為大寫

7、輸出格式

awk 提供 printf 函數進行格式化輸出功能

語法格式(如果你學過C語言,那麼這個你應該很熟悉了)

printf("%12s,%02d,%0.2f\n",s,d,g);

常用的格式化方式:

  • %d 十進位有符號整數
  • %u 十進位無符號整數
  • %f 浮點數
  • %s 字元串
  • %c 單個字元
  • %e 指數形式的浮點數
  • %x %X 無符號以十六進位表示的整數
  • %0 無符號以八進位表示的整數
  • %g 自動選擇合適的表示法
  • \n 換行符
  • \t Tab符

上面我們悄悄的提到awk也是一種編程語言,相信你還沒有忘記吧。不信的話你回頭看看(●'◡'●)

既然是編程語言,那麼它肯定是支持 條件語句、迴圈語句、數組、函數等的

8、實踐操作

光說不練假把式,上面說了這麼多其用法。接下來我們就實際操練一番唄

以下操作都是基於myfile.txt 文本來操作的,內容如下

[root@xiezhr test]# cat myfile.txt 
-rw-r--r-- 1 root   root     44 Mar 26 14:43 a1.txt
-rw-r--r-- 1 root   root     65 Mar 26 14:56 a2.txt
-rw-r--r-- 1 root   xiezhr   92 Mar 26 15:00 a.txt
-rwxr-xr-x 1 xiezhr xiezhr    0 Mar 14 22:37 c.txt
drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
-rw-r--r-- 1 root   root      0 Mar 17 23:03 dir2
drwxr-xr-x 2 root   xiezhr 4096 Mar 17 23:03 dir3
drwxr-xr-x 2 root   root   4096 Mar 18 20:48 dir5
drwxr-xr-x 2 root   root   4096 Mar 18 21:18 dir6
drwxr-xr-x 2 root   root   4096 Mar 13 15:27 dir_bak
-rw-r--r-- 1 root   root     14 Apr  9 11:23 file1.txt
-rw-r--r-- 1 root   root    117 Apr  9 11:04 file.txt
-rw-r--r-- 1 root   root    132 Mar 17 00:18 movie.tar.gz
-rw-r--r-- 1 root   root     15 Mar 26 10:41 m.tx
-rw-r--r-- 1 root   root      0 Apr 17 10:27 myfile.txt
-rw-r--r-- 1 root   root    192 Mar 26 14:28 test1.txt
-rw-r--r-- 1 root   root      6 Mar 26 10:05 test2.txt
-rw-r--r-- 1 root   root     10 Mar 26 10:24 test3.txt
-rw-r--r-- 1 root   root     44 Mar 17 22:27 test.txt
-rw-r--r-- 1 root   root      0 Mar 11 22:52 tt.txt
-rw-r--r-- 1 root   root     31 Mar 26 21:08 xaa
-rw-r--r-- 1 root   root     45 Mar 26 21:08 xab
-rw-r--r-- 1 root   root     16 Mar 26 21:08 xac
-rw-r--r-- 1 root   root    527 Apr  9 10:55 xiezhr.txt

① 顯示文件中第3行

[root@xiezhr test]# awk 'NR==3' myfile.txt 
-rw-r--r-- 1 root   xiezhr   92 Mar 26 15:00 a.txt

NR在上面已經提到過了,表示行號。NR==3 表示第三行。==表示等於,=表示賦值,這裡別寫錯了哈。

② 顯示3到5行

[root@xiezhr test]# awk 'NR==3,NR==5' myfile.txt 
-rw-r--r-- 1 root   xiezhr   92 Mar 26 15:00 a.txt
-rwxr-xr-x 1 xiezhr xiezhr    0 Mar 14 22:37 c.txt
drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir

③ 顯示輸出文件中的1、3、5 列

[root@xiezhr test]# awk '{print $1,$3,$5}' myfile.txt 
-rw-r--r-- root 44
-rw-r--r-- root 65
-rw-r--r-- root 92
-rwxr-xr-x xiezhr 0
drwxr-xr-x xiezhr 4096
-rw-r--r-- root 0
drwxr-xr-x root 4096
drwxr-xr-x root 4096
drwxr-xr-x root 4096
drwxr-xr-x root 4096
-rw-r--r-- root 14
-rw-r--r-- root 117
-rw-r--r-- root 132
-rw-r--r-- root 15
-rw-r--r-- root 0
-rw-r--r-- root 192
-rw-r--r-- root 6
-rw-r--r-- root 10
-rw-r--r-- root 44
-rw-r--r-- root 0
-rw-r--r-- root 31
-rw-r--r-- root 45
-rw-r--r-- root 16
-rw-r--r-- root 527

還有一種寫法,這次我們來列印1、3和最後一列(之所以要列印最後一列,是因為我們要引入新的知識點O(∩_∩)O)

[root@xiezhr test]# awk -F " " '{print $1,$2,$NF}' myfile.txt 
-rw-r--r-- 1 a1.txt
-rw-r--r-- 1 a2.txt
-rw-r--r-- 1 a.txt
-rwxr-xr-x 1 c.txt
drwxr-xr-x 2 dir
-rw-r--r-- 1 dir2
drwxr-xr-x 2 dir3
drwxr-xr-x 2 dir5
drwxr-xr-x 2 dir6
drwxr-xr-x 2 dir_bak
-rw-r--r-- 1 file1.txt
-rw-r--r-- 1 file.txt
-rw-r--r-- 1 movie.tar.gz
-rw-r--r-- 1 m.tx
-rw-r--r-- 1 myfile.txt
-rw-r--r-- 1 test1.txt
-rw-r--r-- 1 test2.txt
-rw-r--r-- 1 test3.txt
-rw-r--r-- 1 test.txt
-rw-r--r-- 1 tt.txt
-rw-r--r-- 1 xaa
-rw-r--r-- 1 xab
-rw-r--r-- 1 xac
-rw-r--r-- 1 xiezhr.txt
  • -F 指定分隔符,F要是大寫哦
  • NF表示最後一列,$1 表示第一列,$2 表示第二列,$3表示第三列.......依次類推,但是$0表示一整行

④格式輸出我們想要的內容。

[root@xiezhr test]# awk '{printf "%-4s,%-2s,%-4s\n",$1,$3,$5}' myfile.txt 
-rw-r--r--,root,44  
-rw-r--r--,root,65  
-rw-r--r--,root,92  
-rwxr-xr-x,xiezhr,0   
drwxr-xr-x,xiezhr,4096
-rw-r--r--,root,0   
drwxr-xr-x,root,4096
drwxr-xr-x,root,4096
drwxr-xr-x,root,4096
drwxr-xr-x,root,4096
...
  • 學過C語言的你可能已經發現了,這裡的格式輸出跟C語言中printf用法是一樣的
  • %s 表示占位符
  • -4 表示列寬為4,且左對齊

⑤ 過濾出第四列是xiezhr,第七列是17的記錄

[root@xiezhr test]# awk '$4=="xiezhr" && $7==17 {print $0}' myfile.txt 
drwxr-xr-x 2 root   xiezhr 4096 Mar 17 23:03 dir3

⑥ 指定"|"分隔符,並列印出來

[root@xiezhr test]# awk '{print $1,"|",$3}' myfile.txt 
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rwxr-xr-x | xiezhr
drwxr-xr-x | xiezhr
-rw-r--r-- | root
drwxr-xr-x | root
drwxr-xr-x | root
drwxr-xr-x | root
drwxr-xr-x | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root
-rw-r--r-- | root

⑦ 條件(正則表達式)匹配(過濾出xiezhr用戶的所有文件,以及最後一行)

[root@xiezhr test]# awk '$3 ~/xiezhr/ || NR==NF {print NR,$0}' myfile.txt 
4 -rwxr-xr-x 1 xiezhr xiezhr    0 Mar 14 22:37 c.txt
5 drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
9 drwxr-xr-x 2 root   root   4096 Mar 18 21:18 dir6

gsub替換內容(我們把文件中的-rw-r--r-- 替換成xiezhrspace)

[root@xiezhr test]# awk '{gsub("-rw-r--r--","xiezhrspace",$0);print $0}' myfile.txt 
xiezhrspace 1 root   root     44 Mar 26 14:43 a1.txt
xiezhrspace 1 root   root     65 Mar 26 14:56 a2.txt
xiezhrspace 1 root   xiezhr   92 Mar 26 15:00 a.txt
-rwxr-xr-x 1 xiezhr xiezhr    0 Mar 14 22:37 c.txt
drwxr-xr-x 2 xiezhr xiezhr 4096 Mar 26 21:46 dir
xiezhrspace 1 root   root      0 Mar 17 23:03 dir2
drwxr-xr-x 2 root   xiezhr 4096 Mar 17 23:03 dir3
drwxr-xr-x 2 root   root   4096 Mar 18 20:48 dir5
drwxr-xr-x 2 root   root   4096 Mar 18 21:18 dir6
drwxr-xr-x 2 root   root   4096 Mar 13 15:27 dir_bak
xiezhrspace 1 root   root     14 Apr  9 11:23 file1.txt
xiezhrspace 1 root   root    117 Apr  9 11:04 file.txt
xiezhrspace 1 root   root    132 Mar 17 00:18 movie.tar.gz
xiezhrspace 1 root   root     15 Mar 26 10:41 m.tx
xiezhrspace 1 root   root      0 Apr 17 10:27 myfile.txt
xiezhrspace 1 root   root    192 Mar 26 14:28 test1.txt
xiezhrspace 1 root   root      6 Mar 26 10:05 test2.txt
xiezhrspace 1 root   root     10 Mar 26 10:24 test3.txt
xiezhrspace 1 root   root     44 Mar 17 22:27 test.txt
xiezhrspace 1 root   root      0 Mar 11 22:52 tt.txt
xiezhrspace 1 root   root     31 Mar 26 21:08 xaa
xiezhrspace 1 root   root     45 Mar 26 21:08 xab
xiezhrspace 1 root   root     16 Mar 26 21:08 xac
xiezhrspace 1 root   root    527 Apr  9 10:55 xiezhr.txt
  • 這裡用了akw 的查找替換功能,即gsub函數,gsub在上面已經具體說過了,如果忘記了可以返回去看看

⑨ if語句(前面說過awk還是一種編程語言,可能你也是半信半疑的,這裡就來演示一下awk的if語句,讓你見識一下,

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Rust + Bevy 實現的 Flappy Bird 游戲 簡介 一個使用 bevy 引擎復刻的 Flappy Bird 經典小游戲。 通過該項目我們可以學到:bevy 的自定義組件,自定義插件,自定義資源,sprite 的旋轉,sprite 的移動,sprite sheet 動畫的定義使用,狀態 ...
  • skywalking是使用位元組碼操作技術和AOP概念攔截Java類方法的方式來追蹤鏈路的,由於skywalking已經打包了位元組碼操作技術和鏈路追蹤的上下文傳播,因此只需定義攔截點即可。 這裡以skywalking-8.7.0版本為例。 關於插件攔截的原理,可以看我的另一篇文章:skywalking ...
  • 在微服務架構中,一次請求可能會被多個服務處理,而每個服務又會產生相應的日誌,且每個服務也會有多個實例。在這種情況下,如果系統發生異常,沒有 Trace ID,那麼在進行日誌分析和追蹤時就會非常困難,因為我們無法將所有相關的日誌信息串聯起來。 如果將 Trace ID 添加到響應頭中,那麼在進行日誌分 ...
  • 前言 在C語言中,賦值運算符用於將一個值賦給變數 這個過程分為兩個步驟: 計算賦值運算符右側的表達式 將結果賦給左側的變數。 C語言提供了多個不同的賦值運算符,包括基本的賦值運算符、複合賦值運算符以及條件賦值運算符等 一、人物簡介 第一位閃亮登場,有請今後會一直教我們C語言的老師 —— 自在。 第二 ...
  • 1.實驗器材 Arduino開發板,麵包板一塊,杜邦線若幹,LED燈若幹,220歐電阻若幹,蜂鳴器一個。 2.實驗操作 將六個led燈的正極依次接到arduino板I/O介面的2-7口, 電源負極依分別接一個220歐的電阻 。 整體負極接arduino板的GND介面。 蜂鳴器正極接arduino板I ...
  • dynamic簡介 dynamic是.NET Framework4.0的新特性。dynamic的出現讓C#具有了弱語言類型的特性。編譯器在編譯的時候不再對類型進行檢查,編譯時預設dynamic對象支持你想要的任何特性。 dynamic簡化反射實現 使用dynamic來簡化反射實現是一種比較常見的編程 ...
  • 隨著技術的發展,ASP.NET Core MVC也推出了好長時間,經過不斷的版本更新迭代,已經越來越完善,本系列文章主要講解ASP.NET Core MVC開發B/S系統過程中所涉及到的相關內容,適用於初學者,在校畢業生,或其他想從事ASP.NET Core MVC 系統開發的人員。 經過前幾篇文章... ...
  • 1、前言 學會使用 GNU Radio 中的 ZMQ,是從低階使用者向高階邁進的第一步! 因為學會了 ZMQ,就可以將 GNU Radio 中的實時數據流通過 socket 引到外面的 python/c 等大型應用程式中,做數據分析、展示、人工智慧等。 來自 ZeroMQ 官方介紹:ZeroMQ ( ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...