Linux系統中grep命令是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹 配的行列印出來。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用許可權是所有用戶。 grep的工作方式是這樣的,它在一個或多個文件中搜索字元串模板。如 ...
Linux系統中grep命令是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹 配的行列印出來。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用許可權是所有用戶。
grep的工作方式是這樣的,它在一個或多個文件中搜索字元串模板。如果模板包括空格,則必須被引用,模板後的所有字元串被看作文件名。搜索的結果被送到標準輸出,不影響原文件內容。
grep可用於shell腳本,因為grep通過返回一個狀態值來說明搜索的狀態,如果模板搜索成功,則返回0,如果搜索不成功,則返回1,如果搜索的文件不存在,則返回2。我們利用這些返回值就可進行一些自動化的文本處理工作。
一.命令格式:
grep [-abcEFGhHilLnqrsvVwxy][-A<顯示列數>][-B<顯示列數>][-C<顯示列數>][-d<進行動作>][-e<範本樣式>][-f<範本文件>][--help][範本樣式][文件或目錄...]
二.命令功能:
用於過濾/搜索的特定字元。可使用正則表達式能多種命令配合使用,使用上十分靈活。
三.命令參數:
參數 | 描述 |
---|---|
-a | 或 --text : 不要忽略二進位的數據。 |
-A<顯示行數> | 或 --after-context=<顯示行數> : 除了顯示符合範本樣式的那一列之外,並顯示該行之後的內容。 |
-b | 或 --byte-offset : 在顯示符合樣式的那一行之前,標示出該行第一個字元的編號。 |
-B<顯示行數> | 或 --before-context=<顯示行數> : 除了顯示符合樣式的那一行之外,並顯示該行之前的內容。 |
-c | 或 --count : 計算符合樣式的列數。 |
-C<顯示行數> | 或 --context=<顯示行數>或-<顯示行數> : 除了顯示符合樣式的那一行之外,並顯示該行之前後的內容。 |
-d <動作> | 或 --directories=<動作> : 當指定要查找的是目錄而非文件時,必須使用這項參數,否則grep指令將回報信息並停止動作。 |
-e<範本樣式> | 或 --regexp=<範本樣式> : 指定字元串做為查找文件內容的樣式。 |
-E | 或 --extended-regexp : 將樣式為延伸的普通表示法來使用。 |
-f<規則文件> 或 --file=<規則文件> : 指定規則文件,其內容含有一個或多個規則樣式,讓grep查找符合規則條件的文件內容,格式為每行一個規則樣式。 | |
-F | 或 --fixed-regexp : 將樣式視為固定字元串的列表。 |
-G | 或 --basic-regexp : 將樣式視為普通的表示法來使用。 |
-h | 或 --no-filename : 在顯示符合樣式的那一行之前,不標示該行所屬的文件名稱。 |
-H | 或 --with-filename : 在顯示符合樣式的那一行之前,表示該行所屬的文件名稱。 |
-i | 或 --ignore-case : 忽略字元大小寫的差別。 |
-l | 或 --file-with-matches : 列出文件內容符合指定的樣式的文件名稱。 |
-L | 或 --files-without-match : 列出文件內容不符合指定的樣式的文件名稱。 |
-n | 或 --line-number : 在顯示符合樣式的那一行之前,標示出該行的列數編號。 |
-q | 或 --quiet或--silent : 不顯示任何信息。 |
-r | 或 --recursive : 此參數的效果和指定"-d recurse"參數相同。 |
-s | 或 --no-messages : 不顯示錯誤信息。 |
-v | 或 --revert-match : 顯示不包含匹配文本的所有行。 |
-V | 或 --version : 顯示版本信息。 |
-w | 或 --word-regexp : 只顯示全字元合的列。 |
-x | --line-regexp : 只顯示全列符合的列。 |
-y | 此參數的效果和指定"-i"參數相同。 |
四. 規則表達式
grep 的規則表達式
表達式 | 描述 |
---|---|
^ | 錨定行的開始 如:'^grep'匹配所有以grep開頭的行。 |
$ | 錨定行的結束 如:'grep$'匹配所有以grep結尾的行。 |
. | 匹配一個非換行符的字元 如:'gr.p'匹配gr後接一個任意字元,然後是p。 |
* | 匹配零個或多個先前字元 如:'*grep'匹配所有一個或多個空格後緊跟grep的行。 |
.* | 一起用代表任意字元。 |
[] | 匹配一個指定範圍內的字元,如'[Gg]rep'匹配Grep和grep。 |
[^] | 匹配一個不在指定範圍內的字元,如:'[^A-FH-Z]rep'匹配不包含A-F和H-Z的一個字母開頭,緊跟rep的行。 |
\(..) #標記匹配字元,如'(love)',love被標記為1。 | |
< | 錨定單詞的開始,如:'<grep'匹配包含以grep開頭的單詞的行。 |
> | 錨定單詞的結束,如'grep>'匹配包含以grep結尾的單詞的行。 |
x{m} | 重覆字元x,m次,如:'0{5}'匹配包含5個o的行。 |
x{m,} | 重覆字元x,至少m次,如:'o{5,}'匹配至少有5個o的行。 |
x{m,n} | 重覆字元x,至少m次,不多於n次,如:'o{5,10}'匹配5--10個o的行。 |
\w | 匹配文字和數字字元,也就是[A-Za-z0-9],如:'G\w*p'匹配以G後跟零個或多個文字或數字字元,然後是p。 |
\W | \w的反置形式,匹配一個或多個非單詞字元,如點號句號等。 |
\b | 單詞鎖定符,如: '\bgrep\b'只匹配grep。 |
POSIX字元:
為了在不同國家的字元編碼中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字元類,如[:alnum:]是[A-Za-z0-9]的另一個寫法。要把它們放到[]號內才能成為正則表達式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字元類。
字元 | 描述 |
---|---|
[:alnum:] | 文字數字字元 |
[:alpha:] | 文字字元 |
[:digit:] | 數字字元 |
[:graph:] | 非空字元(非空格、控制字元) |
[:lower:] | 小寫字元 |
[:cntrl:] | 控制字元 |
[:print:] | 非空字元(包括空格) |
[:punct:] | 標點符號 |
[:space:] | 所有空白字元(新行,空格,製表符) |
[:upper:] | 大寫字元 |
[:xdigit:] | 十六進位數字(0-9,a-f,A-F) |
五. 使用實例
1. 查找指定進程
命令:
ps -ef|grep uwsgi
輸出:
[root@localhost autoAweme]# ps -ef|grep uwsgi
root 30568 795 0 12月01 ? 00:00:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 30568 0 12月01 ? 00:00:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 795 1 12月04 ? 00:13:13 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 59379 0 12月04 ? 00:00:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 112483 86053 0 09:29 pts/1 00:00:00 grep --color=auto uwsgi
說明:
除最後一條記錄外,其他的都是查找出的進程;最後一條記錄結果是grep進程本身,並非真正要找的進程。
2. 查找指定進程時,不顯示grep 本身進程
命令:
ps aux | grep uwsgi | grep -v "grep"
ps aux|grep [u]wsgi
ps aux|grep /[u]wsgi
輸出:
[root@localhost test]# ps -aux | grep uwsgi
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:50 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 87765 0.0 0.0 112704 1016 pts/1 R+ 10:14 0:00 grep --color=auto uwsgi
[root@localhost test]# ps -aux | grep uwsgi | grep -v "grep"
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:50 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
[root@localhost test]# ps -aux | grep [u]wsgi
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:45 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
[root@localhost test]# ps -aux | grep \[u]wsgi
root 30568 0.0 1.3 310244 53696 ? S 12月01 0:23 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 30578 0.0 1.2 310244 49556 ? S 12月01 0:00 /home/hc/project/envs/pgc/bin/uwsgi --ini /home/hc/project/pgc.ini
root 59379 1.5 1.3 457952 50236 ? Sl 12月04 13:45 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
root 59406 0.0 1.3 467760 53104 ? S 12月04 0:03 /home/hc/project/envs/autoAweme/bin/uwsgi --ini /home/hc/project/autoAweme.ini
3. 查找指定進程個數
命令:
ps -ef|grep uwsgi -c
ps -ef|grep -c uwsgi
輸出:
[root@localhost autoAweme]# ps -ef|grep uwsgi -c
5
[root@localhost autoAweme]# ps -ef|grep -c uwsgi
5
4. 從文件中讀取關鍵詞進行搜索
命令:
cat 3.log | grep -f 4.log
輸出:
[root@localhost test]# cat 3.log
1
2
3
[root@localhost test]# cat 4.log
1
12
5
43
[root@localhost test]# cat 3.log | grep -f 4.log
1
[root@localhost test]# cat 4.log | grep -f 3.log
1
12
43
說明:
cat 3.log | grep -f 4.log 從3.log文件中匹配出含有4.log中關鍵字的行並輸出
cat 4.log | grep -f 3.log 從4.log文件中匹配出含有3.log中關鍵字的行並輸出
如:4.log中的關鍵字有1,12,5,43四個,在3.log中無論是完全匹配還是部分匹配只能匹配到1,並輸出
在 3.log中關鍵字為1,2,3, 所以在4.log中匹配3時,能完全匹配到含有1,2,3的行,並把匹配部分著色表示輸出
5. 從文件中讀取關鍵詞進行搜索 且顯示行號
命令:
cat 4.log | grep -nf 3.log
輸出:
[root@localhost test]# cat 4.log | grep -nf 3.log
1:1
2:12
4:43
[root@localhost test]# cat 3.log | grep -nf 4.log
1:1
說明:
輸出4.log文件中含有從3.log 文件中讀取出的關鍵詞的內容行,並顯示每一行的行號,冒號(:)左邊是行號,右邊是匹配的內容
6. 從文件中查找關鍵詞
命令:
grep "1" 4.log
輸出:
[root@localhost test]# cat 4.log
1
12
"1"
5
43
[root@localhost test]# grep 1 4.log
1
12
"1"
[root@localhost test]# grep '1' 4.log
1
12
"1"
[root@localhost test]# grep "1" 4.log
1
12
"1"
[root@localhost test]# grep \"1\" 4.log
"1"
說明:
有無引號,或者單雙引號 效果是一樣的,但是加上引號可讀性好一點。另外如果要查詢帶引號的內容,需要用\進行轉義
7. 從多個文件中查找關鍵詞
命令:
grep '1' 3.log 4.log
輸出:
[root@localhost test]# grep '1' 3.log 4.log
3.log:1
4.log:1
4.log:12
4.log:"1"
[root@localhost test]# grep -n 1 3.log 4.log
3.log:1:1
4.log:1:1
4.log:2:12
4.log:3:"1"
說明:
多文件時,輸出查詢到的信息內容行時,會把文件的命名放在在行的最左邊輸出並且加上":"作為標示符分隔,如果用了-n展示行號,則第二個:的左邊是行號,最右邊的是匹配內容
8.找出以1開頭的行內容
命令:
cat 4.log |grep ^1
輸出:
[root@localhost test]# cat 4.log
1
12
"1"
5
43
[root@localhost test]# cat 4.log |grep ^1
1
12
9.找出非1開頭的行內容
命令:
cat 4.log |grep ^[^1]
輸出:
[root@localhost test]# cat 4.log |grep ^[^1]
"1"
5
43
10.找出以3結尾的行內容
命令:
cat 4.log |grep 3$
輸出:
[root@localhost test]# cat 4.log |grep 3$
43
11.在當前目錄中,查找尾碼有 log 字樣的文件中包含 1 字元串的文件,並列印出該字元串的行
命令:
grep 1 *log
輸出:
[root@localhost test]# ls
1.log 2.log 2.log.back 3.log 4.log
[root@localhost test]# grep 1 *log
3.log:1
4.log:1
4.log:12
4.log:"1"
12 . 以遞歸的方式查找符合條件的文件
命令:
grep -r 僅此一條 /home/hc
輸出:
[root@localhost hc]# grep -r 僅此一條 /home/hc
/home/hc/test/2.log.back:僅此一條,我是第五行
[root@localhost hc]#
說明:
查找指定目錄/home/hc 及其子目錄(如果存在子目錄的話)下所有文件中包含字元串"僅此一條"的文件,並列印出該字元串所在行的內容
13.反向查找
命令:
grep -v 僅此一條 *
輸出:
[root@localhost test]# ls
1.log 2.log 2.log.back 3.log 4.log
[root@localhost test]# grep 僅此一條 *
2.log.back:僅此一條,我是第五行
[root@localhost test]# grep -v 僅此一條 *
1.log:hnlinux
1.log:
1.log:hpython.cn
1.log:
1.log:ubuntu
1.log:
1.log:ubuntu linux
1.log:
1.log:redhat
1.log:
1.log:Redhat
1.log:
1.log:linuxmint
2.log:linux
2.log:
2.log:Redhat
2.log.back:第一行
2.log.back:第二行
2.log.back:我是log2第3行
2.log.back:第四行
3.log:1
3.log:2
3.log:3
4.log:1
4.log:12
4.log:"1"
4.log:5
4.log:43
說明:
查找當前目錄下所有文件,找出其中不包含"僅此一條"的行