grep 文本搜索工具，根據用戶指定的“模式”對目標文本逐行進行匹配檢查；列印匹配到的行 grep [OPTIONS] PATTERN [FILE…] –color=auto: 對匹配到的文本著色顯示 -v: 顯示不被pattern匹配到的行 -i: 忽略字元大小寫 -n: 顯示匹配的行號 -c: ...

^grep

文本搜索工具，根據用戶指定的“模式”對目標文本逐行進行匹配檢查；列印匹配到的行

grep [OPTIONS] PATTERN [FILE…]

–color=auto: 對匹配到的文本著色顯示
-v: 顯示不被pattern匹配到的行
-i: 忽略字元大小寫
-n: 顯示匹配的行號
-c: 統計匹配的行數
-o: 僅顯示匹配到的字元串
-q: 靜默模式，不輸出任何信息
-A #: after, 顯示匹配到的行和後#行
-B #: before, 顯示匹配到的行和前#行
-C #:context, 顯示匹配到的行和前後各#行
-e: 實現多個選項間的邏輯or關係。grep –e ‘cat ’ -e ‘dog’ file
-w: 整行匹配整個單詞
-E: 使用擴展正則表達式
-F: 相當於fgrep，不支持正則表達式

sed

sed是一種流編輯器，它一次處理一行內容。處理時，把當前處理的行存儲在臨時緩衝區中，稱為“模式空間”( pattern space)，接著用sed命令處理緩衝區中的內容，處理完成後，把緩衝區的內容送往屏幕。接著處理下一行，這樣不斷重覆，直到文件末尾。文件內容並沒有改變，除非你使用重定向存儲輸出。Sed主要用來自動編輯一個或多個文件,簡化對文件的反覆操作,編寫轉換程式等

sed [option]… script inputfile…

-n: 不輸出模式空間內容到屏幕，即不自動列印
-e: 多點編輯
-f: /PATH/SCRIPT_FILE: 從指定文件中讀取編輯腳本
-r: 支持使用擴展正則表達式
-i: 原處編輯
-i.bak: 原處編輯，編輯前複製源文件為源文件名稱+.bak尾碼

script=地址定界+編輯命令

地址定界

不給地址:對全文進行處理
單地址:
- #: 指定的行
- /pattern/:被此處模式所能夠匹配到的每一行
地址範圍:
- #,#:
- #,+#
- /pat1/,/pat2/
- #,/pat1/
~:步進
- 1~2: 從1開始，步進2，表示奇數行
- 2~2 從2開始，步進2，表示偶數行

編輯命令

d: 刪除模式空間匹配的行
p: 顯示模式空間中的內容
a []text: 在指定行後面追加文本支持使用\n實現多行追加
i []text: 在行前面插入文本
c []text: 替換行為單行或多行文本
w /path/somefile: 保存模式匹配的行至指定文件
r /path/somefile: 讀取指定文件的文本至模式空間中
匹配到的行後 =: 為模式空間中的行列印行號
!: 模式空間中匹配行取反處理

查找替換

s///:查找替換,支持使用其它分隔符，s@@@，s###
替換標記:
- g: 行內全局替換
- p: 顯示替換成功的行
- w /PATH/TO/SOMEFILE:將替換成功的行保存至文件中

高級編輯命令

h: 把模式空間中的內容覆蓋至保持空間中
H:把模式空間中的內容追加至保持空間中
g: 從保持空間取出數據覆蓋至模式空間
G:從保持空間取出內容追加至模式空間
x: 把模式空間中的內容與保持空間中的內容進行互換
n: 讀取下一行到模式空間，且後期的操作命令只對該行有效
N: 讀取下一行到模式空間，且後期的操作命令對模式空間的所有行有效
d: 刪除模式空間中的行
D:刪除當前模式空間開端至\n的內容(不再傳至標準輸出)，放棄之後的命令，但是對剩餘模式空間重新執行sed

awk

AWK是由Aho, Weinberger, Kernighan這三個人共同開發出的一優良的文本處理工具，Linux及Unix環境中現有的功能最強大的數據處理引擎之一。

awk [options] ‘program’ var=value file…
awk [options] -f programfile var=value file…
awk [options] ‘BEGIN{ action;… } pattern{ action;… } END{ action;… }’ file …

options
- -F 指明輸入時用到的欄位分隔符
- -v var=value: 自定義變數
- -f 指定awk程式文件
BEGIN{ action;… }: 讀入文本之前執行{action;…}
END{ action;… }: 文本處理完之後執行{ action;… }
pattern{ action;… }: pattern的返回值為True時，才執行{action;…}，pattern可以有以下幾種:
- 如果未指定pattern: 匹配每一行
- /regular expression/: 僅處理能夠被模式(正則表達式匹配到的行，需要用/ /括起來
- relational expression: 關係表達式，
  */pat1/,/pat2/: 行範圍startline,endline不支持直接給出數字格式
- True: 結果為非0值，非空字元串
- False: 結果為空字元串或0值

awk工作流程

第一步:執行BEGIN{action;… }語句塊中的語句
第二步:從文件或標準輸入(stdin)讀取一行，然後執行pattern{ action;… }語句塊，它逐行掃描文件，從第一行到最後一行重覆這個過程，直到文件全部被讀取完畢。
第三步:當讀至輸入流末尾時，執行END{action;…}語句塊。
.
BEGIN語句塊在awk開始從輸入流中讀取行之前被執行，這是一個可選的語句塊，比如變數初始化、列印輸出表格的表頭等語句通常可以寫在BEGIN語句塊中
END語句塊在awk從輸入流中讀取完所有的行之後即被執行，比如列印所有行的分析結果這類信息彙總都是在END語句塊中完成，它也是一個可選語句塊
pattern語句塊中的通用命令是最重要的部分，也是可選的。如果沒有提供pattern語句塊，則預設執行{ print }，即列印每一個讀取到的行，awk讀取的每一行都會執行該語句塊

awk內置命令

print

print item1, item2, …

特性

item之間用逗號分隔符
輸出的各item可以是字元串、數值、當前記錄的欄位、變數、awk表達式
省略item，相當於print$0

printf

printf “FORMAT”, item1, item2, …

特性

必須指定FORMAT
不會自動換行，需要顯式給出換行控制符，\n
FORMAT中需要分別為後面每個item指定格式符

FORMAT=格式符+修飾符

格式符
- %c: 顯示字元的ASCII碼
- %d, %i: 顯示十進位整數
- %e, %E:顯示科學計數法數值
- %f: 顯示為浮點數
- %g, %G:以科學計數法或浮點形式顯示數值
- %s: 顯示字元串
- %u: 無符號整數
- %%: 顯示%自身
修飾符:
- #[.#]: 第一個數字控制顯示的寬度，第二個#表示小數點後精度
- -: 左對齊(預設右對齊) %-15s
- +: 顯示數值的正負符號 %+d

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

[root@7-movekj ~]$ awk 'BEGIN{print "Colum1,Colum2"}' Colum1,Colum2 [root@7-movekj ~]$ awk 'BEGIN{printf "%-10s,%8s\n","Colum1","Colum2"}' Colum1 , Colum2 [root@7-movekj ~]$ awk 'BEGIN{printf "%-10s,%-8s\n","Colum1","Colum2"}' Colum1 ,Colum2 [root@7-movekj ~]$ awk 'BEGIN{printf "%.2f",2}' 2.00 [root@7-movekj ~]$ awk 'BEGIN{printf "%10.2f",2}' 2.00[root@7-movekj ~]$ awk 'BEGIN{printf "%-10.2f",2}' 2.00 [root@7-movekj ~]$ awk 'BEGIN{printf "%-10.2f",3}' 3.00 [root@7-movekj ~]$ awk 'BEGIN{printf "%-10.2d",3}' 03 [root@7-movekj ~]$ awk 'BEGIN{printf "%10.2d",3}' 03[root@7-movekj ~]$ awk 'BEGIN{printf "%10.3d",3}' 003[root@7-movekj ~]$

awk變數

內置變數

FS: 輸入欄位分隔符，預設為空白字元
OFS: 輸出欄位分隔符，預設為空白字元
RS: 輸入記錄分隔符，指定輸入時的換行符，原換行符仍有效
ORS: 輸出記錄分隔符，輸出時用指定符號代替換行符
NF: 當前行的欄位數量
NR: 當前行的行號
FNR: 各文件分別計數,行號
FILENAME: 當前文件名
ARGC: 命令行參數的個數
ARGV: 數組，保存的是命令行所給定的各參數

自定義變數(區分字元大小寫)

-v var=value
在program中直接定義

1 2 3 4 5

[root@7-movekj ~]$ awk -v test='hello gawk' 'BEGIN{print test}' hello gawk [root@7-movekj ~]$ awk 'BEGIN{test="hello,gawk";print test}' hello,gawk

awk操作符

算術操作符: x+y, x-y, x*y, x/y, x^y, x%y
-x: 轉換為負數
+x: 轉換為數值
字元串操作符: 沒有符號的操作符，字元串連接
賦值操作符: =, +=, -=, *=, /=, %=, ^=，++, —
比較操作符: ==, !=, >, >=, <, <=
模式匹配符: 支持正則表達式
- ~: 左邊是否和右邊匹配包含
- !~: 是否不匹配
邏輯操作符:與&&，或||，非!
條件表達式(三目表達式): selector?if-true-expression:if-false-expression

awk action

Expressions: 算術、比較表達式等
Control statements: if、 while等
Compound statements: 組合語句
input statements: 沒用過
output statements: print、printf等

awk 控制語句

分支語句

if(condition){statement;…}[else statement]
if(condition1){statement1}else if(condition2){statement2}else{statement3}
switch(expression){case VALUE1 or /REGEXP/: statement1; case VALUE2 or /REGEXP2/: statement2; …; default: statementN}

迴圈語句

while(condition){statement;…}
do{statement;…}while(condition)
for(expr1;expr2;expr3) {statement;…}

控制語句

next: 提前結束對本行處理而直接進入下一行處理
break [n]
continue [n]

awk 數組

數組格式

array[index]

index
- 可使用任意字元串;字元串要使用雙引號括起來
- 如果某數組元素事先不存在，在引用時，awk會自動創建此元素，並將其值初始化為“空串”

數組遍歷

for(idx in array){for-body}

awk函數

內置函數

rand(): 返回0和1之間一個隨機數，使用之前需要先調用srand()函數

1 2	awk 'BEGIN{srand(); for (i=1;i<=10;i++)print int(rand()*100) }'

length([s]): 返回指定字元串的長度
sub(r,s,[t]): 對t字元串進行搜索r表示的模式匹配的內容，並將第一個匹配的內容替換為s

1 2	echo "2008:08:08 08:08:08" \| awk 'sub(/:/,“-",$1)'

gsub(r,s,[t]): 對t字元串進行搜索r表示的模式匹配的內容，並全部替換為s所表示的內容

1 2	echo "2008:08:08 08:08:08" \| awk ‘gsub(/:/,“-",$0)'

split(s,array,[r]): 以r為分隔符，切割字元串s，並將切割後的結果保存至array所表示的數組中，第一個索引值為1,第二個索引值為2,…

1 2	netstat -tan \| awk '/^tcp\>/{split($5,ip,":");count[ip[1]]++} END{for (i in count) {print i,count[i]}}

自定義函數

語法

1 2 3 4 5

function name ( parameter, parameter, ... ) { statements return expression }

示例

1 2 3 4 5 6 7 8 9 10 11 12 13 14

[root@7-movekj awk]$ cat fun.awk #!/bin/awk -f function max(v1,v2) { v1>v2?var=v1:var=v2 return var } BEGIN{ a=3 b=2 print max(a,b) } [root@7-movekj awk]$ awk –f fun.awk

awk中調用shell命令

空格是awk中的字元串連接符，如果system中需要使用awk中的變數可以使用空格分隔，或者說除了awk的變數外其他一律用””引用起來。

示例:

1 2 3 4 5

[root@7-movekj awk]$ awk 'BEGIN{system("hostname") }' 7-movekj.com [root@7-movekj awk]$ awk 'BEGIN{score=100; system("echo your score is " score) }' your score is 100

awk 腳本

普通awk腳本

示例

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

[root@7-movekj awk]$ cat f1.awk #!/bin/awk -f {if($3>=1000)print $1,$3} [root@7-movekj awk]$ ./f1.awk -F: /etc/passwd | head -3 nfsnobody 65534 starli 1000 gentoo 1001 [root@7-movekj awk]$ cat f2.awk {if($3>=1000)print $1,$3} [root@7-movekj awk]$ awk -F: -f f2.awk /etc/passwd | head -3 nfsnobody 65534 starli 1000 gentoo 1001

帶變數的awk腳本

這種方式傳遞給awk腳本的變數在BEGIN過程中不可用。直到首行輸入完成以後，變數才可用。可以通過-v參數，讓awk在執行BEGIN之前得到變數的值。命令行中每一個指定的變數都需要一個-v參數

 1 [root@7-movekj awk]$ cat f3.awk
 2 #!/bin/awk -f
 3 {if($3 >=min && $3<=max)print $1,$3}
 4 [root@7-movekj awk]$ chmod +x f3.awk
 5 [root@7-movekj awk]$ ./f3.awk -F: min=100 max=200 /etc/passwd
 6 systemd-network 192
 7 abrt 173
 8 usbmuxd 113
 9 rtkit 172
10 qemu 107
11 pulse 171

1 2 3 4 5 6 7 8 9 10 11 12

[root@7-movekj awk]$ cat f3.awk #!/bin/awk -f {if($3 >=min && $3<=max)print $1,$3} [root@7-movekj awk]$ chmod +x f3.awk [root@7-movekj awk]$ ./f3.awk -F: min=100 max=200 /etc/passwd systemd-network 192 abrt 173 usbmuxd 113 rtkit 172 qemu 107 pulse 171

文本三劍客

grep

sed

script=地址定界+編輯命令

地址定界

編輯命令

查找替換

高級編輯命令

awk

awk工作流程

awk內置命令

print

printf

awk變數

內置變數

自定義變數(區分字元大小寫)

awk操作符

awk action

awk 控制語句

分支語句

迴圈語句

控制語句

awk 數組

數組格式

數組遍歷

awk函數

內置函數

自定義函數

awk中調用shell命令

awk 腳本

普通awk腳本

帶變數的awk腳本

^grep