grep簡介 grep 是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹配的行列印出來。通常grep有三種版本grep、egrep(等同於grep -E)和fgrep。egrep為擴展的grep,fgrep則為快速grep(固定的字元串來對文本進行搜索,不支持正則表達式的引用但是查詢極為 ...
grep簡介
grep 是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹配的行列印出來。通常grep有三種版本grep、egrep(等同於grep -E)和fgrep。egrep為擴展的grep,fgrep則為快速grep(固定的字元串來對文本進行搜索,不支持正則表達式的引用但是查詢極為快速)。grep是Linux文本處理三劍客之一。
grep使用方式
使用方式:grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
常用選項:--color=auto:對匹配到的文本著色後進行高亮顯示;
-i:忽略字元的大小寫
-o:僅顯示匹配到的字元串
-v:顯示不能被模式匹配到的行
-E:支持使用擴展的正則表達式
-q:靜默模式,即不輸出任何信息
-A #:顯示被模式匹配的行及其後#行
-B #:顯示被模式匹配的行及其前#行
-C #:顯示被模式匹配的行及其前後各#行
註:使用grep匹配時需使用雙引號引起來(單引號為強引用),防止被系統誤認為參數或者特殊命令而報錯。擴展grep使用方式
使用方式:egrep [OPTIONS] PATTERN [FILE...]
grep -E [OPTIONS] PATTERN [FILE...]
-i:忽略字元的大小寫
-o:僅顯示匹配到的字元串本身
-v:顯示不被模式匹配到的行
-q:靜默模式,即不輸出任何信息
-A #:顯示被模式匹配的行及其後#行
-B #:顯示被模式匹配的行及其前#行
-C #:顯示被模式匹配的行及其前後各#行
-G:支持基本正則表達式
grep正則表達式元字元
‘^‘: 錨定行首
‘$’: 錨定行尾
‘.‘: 匹配任一一個字元
‘*’: 匹配零個或多個先前字元
‘\?‘:匹配其前面的字元0次或者1次;
‘\+’:匹配其前面的字元1次或者多次;
‘\{m\}‘:匹配其前面的字元m次(\為轉義字元)
‘\{m,n\}’:匹配其前面的字元至少m次,至多n次
‘[]‘: 匹配一個指定範圍內的字元 | ‘[^]’匹配指定範圍外的任意單個字元
‘\<‘或‘\b’:錨定詞首,‘\>’或‘\b’:錨定詞尾(可用\<PATTERN\>:匹配完整單詞)
‘\(\)’:將多個字元當做一個整體進行處理
後向引用:引用前面的分組括弧中的模式所匹配到的字元
分組括弧中的模式匹配到的內容或被正則表達式引擎自動記錄於內部的變數中:
\1:模式從左側起,第一個左括弧及與之匹配的右括弧之間模式匹配到的內容
\2:模式從左側起,第二個左括弧及與之匹配的右括弧之間模式匹配到的內容...
擴展正則表達式與正則表達式略有不同:
'[]':依舊匹配指定範圍內的任意單個字元;但是有很多特殊匹配方式。
[:digit:] 匹配任意單個數字
[:lower:] 匹配任意單個小寫字母
[:upper:] 匹配任意單個大寫字母
[:alpha:] 匹配任意單個字母
[:alnum:] 匹配任意單個字母或數字
[:punct:] 匹配任意單個符號
[:space:] 匹配單個空格
一些地方取消了轉義字元的使用:
‘?‘:匹配其前面的字元0次或者1次;
‘+’:匹配其前面的字元1次或者多次;
‘{m}‘:匹配其前面的字元m次(\為轉義字元)
‘{m,n}’:匹配其前面的字元至少m次,至多n次
():將一個或多個字元捆綁在一起,當做一個整體進行處理,反向引用照常使用。
‘|’:或(註:‘C|cat’為C與cat,‘(C|c)at才是Cat與cat’)
練習題:
1、列出當前系統上所有已經登錄的用戶的用戶名,註意:同一個用戶登錄多次,則只顯示一次
[root@localhost ~]# who | cut -d' ' -f1|uniq root
2、取出最後登錄到當前系統的用戶的相關信息
[root@localhost ~]# id `last | head -1 | cut -d' ' -f1` uid=0(root) gid=0(root) groups=0(root)
3.取出當前系統上被用戶當做其預設shell最多的那個shell
[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7 /sbin/nologin
4.將/etc/passd中的第三個欄位設置最大的後10個用戶的信息全部改為大寫保存至/tmp/maxuser.txt文件中
[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt [root@localhost ~]# cat /tmp/maxusers.txt NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH EGON:X:1002:1002::/HOME/EGON:/BIN/BASH NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN
5.取出當前主機的IP地址
[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10 192.168.0.133
6.列出/etc目錄下所有已.conf結尾的文件的文件名,並將其名字轉換為大寫後保存至/tmp/etc.conf文件中
[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf [root@localhost ~]# cat /tmp/etc.conf RESOLV.CONF CA-LEGACY.CONF FASTESTMIRROR.CONF LANGPACKS.CONF SYSTEMD.CONF VERSION-GROUPS.CONF LVM.CONF LVMLOCAL.CONF ASOUND.CONF LDAP.CONF MLX4.CONF RDMA.CONF SMTPD.CONF
7.顯示/var目錄下一級子目錄或文件的總數
[root@localhost ~]# ls /var | wc -l 21
8.取出/etc/group第三個欄位數值最小的10個組的名字
[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1 root bin daemon sys adm tty disk lp mem kmem
9.將/etc/fstab和/etc/issue文件的內容合併為同一個內容後保存至/tmp/etc.test文件中
[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test [root@localhost ~]# cat /tmp/etc.test # # /etc/fstab # Created by anaconda on Sat May 13 10:12:58 2017 # # Accessible filesystems, by reference, are maintained under '/dev/disk' # See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info # /dev/mapper/cl-root / xfs defaults 0 0 UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot xfs defaults 0 0 /dev/mapper/cl-swap swap swap defaults 0 0 \S Kernel \r on an \m
對於正則表達式的使用需要多聯繫加強記憶,否則是用不好正則表達式的,在學習過程中切記多寫多背。