linux正則表達式（基礎正則表達式+擴展正則表達式）

-Advertisement-

正則表達式應用非常廣泛，例如：php，Python，java等，但在linux中最常用的正則表達式的命令就是grep(egrep)，sed,awk等，換句話說linux三劍客要想能工作的更高效，就一定離不開正則表達式的配合。 1、什麼是正則表達式？簡單的說，正則表達式就是為處理大量的字元串而定義 ...

正則表達式應用非常廣泛，例如：php，Python，java等，但在linux中最常用的正則表達式的命令就是grep(egrep)，sed,awk等，換句話說linux三劍客要想能工作的更高效，就一定離不開正則表達式的配合。

1、什麼是正則表達式？

簡單的說，正則表達式就是為處理大量的字元串而定義的一套規則和方法。通過定義的這些特殊符號的輔助，系統管理員就可以快速過濾、替換或者輸出需要的字元串。linux正則表達式一般以行為單位處理的。

2、為什麼要學正則表達式

在企業工作中，我們每天做的linux運維工作中，時刻都會面對大量帶有字元串的文本配置、程式、命令輸出及日誌文件等，而我們經常會有迫切的需要從大量的字元串內容中查找符合工作需要的特定字元串，這就要靠正則表達式，因此，可以說正則表達式就是為過濾這樣字元串的需求而生的！

3、容易混淆的兩個註意事項：

1)linux正則表達式一般是以行為單位處理的。

2)正則表達式和我們常用的通配符特殊字元是有本質區別的，例如：ls *.txt 這裡的*就是通配符（表示所有），不是正則表達式。

註意字元集問題：

確保字元集：export LC_ALL=C

---------------------------------------------

基礎正則表達式+擴展正則表達式含義解釋：

---------------------------------------------

. 代表且只能代表任意一個字元（不包括空行）
* 重覆前面任意0個或多個字元
.* 匹配所有字元。（包括空行）
sed -ri 's#(.*)#\1#g' bqh.txt
把前面正則匹配的括弧內的結果，在後面用\1取出來操作。
^ 表示以什麼開頭，^bqh 以bqh開頭
$ 是以什麼結尾
^$ 表示空行。
\ 例\. 就只代表點本身，轉義符號，讓有著特殊身份移動的字元，脫掉馬甲，還原原型\$
^.* 以任意多個字元開頭。
.*$ 以任意多個字元結尾。
(.*) 從第一字元匹配，到空格停止，
[abc] 匹配字元集合內的任意一個字元【a-zA-Z】
[^abc] 匹配不包括^後的任意字元的內容；中括弧里的^為取反，註意和以...開頭區別。
a\{n,m\} 重覆n到m次，前一個重覆的字元。如果有用egrep/sed -r 可以去掉斜線。
\{n,\} 重覆至少n次，前一個重覆的字元。如果有用egrep/sed -r 可以去掉斜線。
\{n\} 重覆n次，前一個重覆的字元。如果有用egrep/sed -r 可以去掉斜線。
①^word 搜索以word開頭的；vi ^ 一行的開夠
②word$ 搜索以word結尾的；vi $ 一行的開頭
③^$ 表示空行。
擴展的正則表達式：ERP（egrep或grep -E)

+ 重覆一個或一個以上前面的字元
？復0個或一個0前面的字元
| 用或的方式查找多個符合的字元串
() 找出“用戶組”字元串

實戰舉例：

^m 搜索以m開頭的

p$搜索以p結尾的

^$表示空號

去掉空行：grep –v “^$” bqh.log

查看去掉的後的空行內容：grep -vn “^$” bqh.log

. 代表且只能代表任意一個字元（不包括空行）

查找帶0的字元：

.* 匹配所有字元。（包括空行）

查找以.結尾的字元：

錯誤方法：grep ".$" bqh.log

正確方法：

grep “\.$” bqh.log

註意：\. 就只代表點本身，轉義符號，讓有著特殊身份移動的字元，脫掉馬甲，還原原型\$

* 例1*重覆1個或多個前面的一個字元。

grep –o “1*” bqh.log //-o精確匹配

^.* 以任意多個字元開頭。

.*$ 以任意多個字元結尾。

[abc] 匹配字元集合內的任意一個字元【a-zA-Z】

匹配字元集合內的a-z任意一個小寫字元：

[^abc] 匹配不包括^後的任意字元的內容；中括弧里的^為取反，註意和以...開頭區別

匹配非數字的任意字元：

a\{n,m\} 重覆n到m次，前一個重覆的字元。如果有用egrep/sed -r /grep -E可以去掉斜線。

\{n,\} 重覆至少n次，前一個重覆的字元。如果有用egrep/sed -r 可以去掉斜線。

\{n\} 重覆n次，前一個重覆的字元。如果有用egrep/sed -r 可以去掉斜線。

註意：egrep，grep -E或sed -r過濾一般特殊字元可以不轉義。多使用參數。

---------------------------------------------------------------------------------

擴展的正則表達式：ERP（egrep或grep -E)

+ 重覆一個或一個以上前面的字元

？復0個或一個0前面的字元

| 用或的方式查找多個符合的字元串

() 找出“用戶組”字元串

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

【.NET Core項目實戰-統一認證平臺】第五章網關篇-自定義緩存Redis

" 【.NET Core項目實戰統一認證平臺】開篇及目錄索引 " 上篇文章我們介紹了2種網關配置信息更新的方法和擴展Mysql存儲，本篇我們將介紹如何使用Redis來實現網關的所有緩存功能，用到的文檔及源碼將會在GitHub上開源，每篇的源代碼我將用分支的方式管理，本篇使用的分支為。附文檔及源 ...
Asp.Net MVC WebAPI的創建與前臺Jquery ajax後臺HttpClient調用詳解

asp.net MVC Web API 由於項目需要好久沒有弄這些重溫一下，以前都覺得WebServers好用誰知道技能更新換代實在太快，哈哈不學習就跟不上了 ...
使用微軟自帶解壓類壓縮文件夾

.net framework 4.5框架以後，可以直接使用微軟官方的ZipFile類實現壓縮、解壓文件（夾），因為即時通信項目中，需要同步OA中的用戶頭像，用戶頭像是通過文件夾保存的，文件夾內結構比較複雜。在即時通信中需要先將OA伺服器上保存的用戶頭像文件夾下載下來，因為直接下載文件夾方法很難，所... ...
C#Log4net記錄日誌

1、下載log4net地址：http://logging.apache.org/log4net/download_log4net.cgi 下載log4net-2.0.8-bin-oldkey.zip到本地，根據自己的需求選擇一個合適的log4net.dll版本即可。 2、log4net.dll放在 ...
QueryableHelper

using System; using System.Collections.Generic; using System.Linq; using System.Linq.Expressions; using System.Reflection; using System.Text; namespac... ...
解決Stm32出現error: #20: identifier "GPIO_InitTypeDef" is undefined異常

該錯誤是我在移植sd卡程式時出現的，錯誤如下： error：#20，查看錯誤，可以發現，這些變數都是系統定義過的，沒有修改過。並且該變數也能成功跳轉被找到。那麼到底是什麼原因呢？逛了一些帖子，嘗試了好幾種方法。突然想到是不是頭文件的問題，果然，spi.h頭文件的問題，添加上stm32l1xx.h； ...
DNS伺服器原理簡述

1. TLD：Top Level Domain 頂級功能變數名稱組織域：.com, .net, .org, .gov, .edu, .mil 國家域：.iq, .tw, .hk, .jp, .cn, ... 2. 功能變數名稱分級根功能變數名稱： . 頂級功能變數名稱：.com .edu .gov .int .net .cn ...
linux通配符含義

linux通配符含義： . 當前目錄**** .. 當前目錄的上一級目錄**** * 通配符，代表任意0個或多個字元***** ？通配符，代表重覆0個或一個0前面的字元 : 連續不同命令的分隔符***** # 配置文件註釋***** | 管道***** ~ 用戶的家目錄***** - 上一次的目錄 ...