LinuxShell——正則表達式

-Advertisement-

LinuxShell——正則表達式摘要：本文主要學習了Shell中的正則表達式。簡介含義正則表達式，也稱作正規表示法，是用於描述字元排列和匹配模式的一種語法規則，它主要用於字元串的模式分割、匹配、査找及替換操作。正則表達式是用來匹配文件中的字元串的方法，它會先把整個文本分成一行一行的字元串 ...

LinuxShell——正則表達式

摘要：本文主要學習了Shell中的正則表達式。

簡介

含義

正則表達式，也稱作正規表示法，是用於描述字元排列和匹配模式的一種語法規則，它主要用於字元串的模式分割、匹配、査找及替換操作。

正則表達式是用來匹配文件中的字元串的方法，它會先把整個文本分成一行一行的字元串，然後從每行字元串中搜索是否有符合正則表達式規則的字元串，如果有則匹配成功，如果沒有則匹配失敗。

正則表達式和通配符的區別

正則表達式用來在文件中匹配符合條件的字元串，通配符用來匹配符合條件的文件名。其實這種區別隻在Shell中適用，因為用來在文件中搜索字元串的命令，如grep、awk、sed等可以支持正則表達式，而在系統中搜索文件的命令，如ls、find、cp等不支持正則表達式，所以只能使用Shell自己的通配符來進行匹配了。

語系對正則表達式的影響

不同環境下語系不同，可能使用正則表達式選取的結果也會有所差異。

使用之前設置語系：

1 [root@localhost ~]# export LANG=C
2 [root@localhost ~]# export LC_ALL=C

元字元

在正則表達式中，我們把用於匹配的特殊符號又稱作元字元。在Shell中，元字元又分為基礎元字元和擴展元字元。

基礎元字元

 1 *：前一個字元匹配0次或任意多次。
 2 .：匹配除換行符外的任意一個字元。
 3 ^：匹配行首。例如：^hello會匹配以hello開頭的行。
 4 $：匹配行尾。例如：hello&會匹配以hello結尾的行。
 5 []：匹配中括弧里的任意一個字元，而且只匹配一個字元。例如：[aoeiu]匹配任意一個母音字母，[0-9]匹配任意一位數字，[a-z][0-9]匹配由小寫字母和一位數字構成的兩位字元。
 6 [^]：匹配除了中括弧里的字元以外的任意一個字元。例如：[^0-9]匹配任意一位非數字字元，[^a-z]匹配任意一位非小寫字母。
 7 \：轉義符，用於取消特殊符號的含義。
 8 \{n\}：表示其前面的字元恰好出現n次。例如：[0-9]\{4\}匹配4位數字，[1][3-8][0-9]\{9\}匹配手機號碼。
 9 \(n,\}：表示其前面的字元出現不少於n次。例如：[0-9]\{2,\}匹配兩位及以上的數字。
10 \{n,m\}：表示其前面的字元至少出現n次，最多出現m次。例如：[a-z]\{6,8\}匹配6到8位的小寫字母。

1）*

正則表達式中的“*”和通配符中的“*”含義不同，正則表達式中的代表前一個字元重覆0次或任意多次。

舉例：

“a*”並不是匹配a後面的任意字元，而是可以匹配所有內容，包括空白行，所以“a*”是沒有意義的。

“aa*”會匹配至少包含一個a的字元串。

“a*b”並不能匹配a和b之間有任意字元的字元串，只能匹配包含了b的字元串。

2）.

正則表達式中的“.”只能匹配一個字元，這個字元可以是任意字元。

舉例：

“a.b”會匹配a和b之間有一個字元的字元串。

“a.*b”會匹配a和b之間有任意字元的字元串。

3）^

正則表達式中的“^”代表匹配行首。

舉例：

“^M”會匹配以“M”開頭的行。

4）$

正則表達式中的“$”代表匹配行尾。

舉例：

“n$”會匹配以“n”結尾的行。

5）[]

正則表達式中的“[]”會匹配中括弧里指定的任意一個字元，註意只能匹配一個字元。

舉例：

“[ao]”要麼匹配一個a字元，要麼匹配一個o字元。

“[A-Z]”會匹配任意一個大寫字母。

6）[^]

正則表達式中的“[^]”會匹配除了中括弧里的字元以外的任意一個字元。

舉例：

“^[^a-zA-Z]”會匹配不以字母開頭的行。

7）\

轉義符會取消特殊符號的含義，將其作為正常的字元串來匹配。

舉例：

“.$”不能匹配使用.結尾的行，因為.有特殊含義，可以使用“\.$”來匹配使用.結尾的行。

8）\{n\}

正則表達式中的“\{n\}”表示其前面的字元恰好出現n次。

舉例：

“a\{3\}”會匹配a字母連續出現3次的字元串，但不會限制之後的字元串，當然也會匹配到“aaaa”。

“a\{3\}[^a]”會匹配a字母連續出現3次的字元串，並且之後不為a的字元串，也就是只匹配a字母連續出現3次的字元串。

9）\{n,\}

正則表達式中的“\{n,\}”表示其前面的字元出現不少於n次。

舉例：

“^[0-9]\{3,\}”會匹配最少連續3個數字開頭的字元串。

10）\{n,m\}

正則表達式中的“\{n,m\}”表示其前面的字元出現不少於n次，不超過m次。

舉例：

“ao\{1,3\}e”會匹配在字母a和字母e之間最少1個、最多3個的o字元串。

擴展元字元

在正則表達式中還有一些元字元，被稱為擴展元字元。有的命令支持這種元字元，比如awk命令，有的命令不支持這種元字元，比如sed命令和grep命令。

1 +：前一個字元匹配1次或任意多次。例如：a+b匹配以a開始以b結尾的字元串。
2 ?：前一個字元匹配0次或1次。例如：a?b匹配ab或者b。
3 |：匹配兩個或多個分支選擇。例如：a|b|c匹配a或者b或者c。
4 ()：匹配其整體為一個字元，即模式單元。可以理解為由多個單個字元組成的大字元。例如：(abc)+會匹配重覆abc這個整體一次或多次的字元串。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

ASP.NET Core在支付寶小程式中使用signalR

Github有一個經過重寫的微信小程式SignalR的js類庫 https://github.com/liangshiw/SignalRMiniProgram-Client 於是我把他改成支付寶小程式的版本，上面這個項目的核心代碼基本沒有變，只是小程式開放介面改了一下，在支付寶小程式就能跑起來了把 ...
App_Code下類無法引用問題

App_Code 下創建的.cs文件僅僅是“內容”不是代碼。設置文件為“編譯”就可正常引用。 ...
C#泛型詳解

這篇文章主要講解C#中的泛型，泛型在C#中有很重要的地位，尤其是在搭建項目框架的時候。一、什麼是泛型泛型是C#2.0推出的新語法，不是語法糖，而是2.0由框架升級提供的功能。我們在編程程式時，經常會遇到功能非常相似的模塊，只是它們處理的數據不一樣。但我們沒有辦法，只能分別寫多個方法來處理不同的 ...
NET EF 連接Oracle 的配置方法記錄

主要記錄下如何在EF 中連接Oracle s資料庫,很傻瓜式,非常簡單,但是不知道的童鞋,也會搞得很難受,我自己就是 1.創一個控制台程式,並且添加 Oracle.ManagedDataAccess.EntityFramework 2.添加完之後,會自動在App.config 中添加一堆配置信息,主 ...
CS程式和BS程式文字轉語音

一、項目中一直用到了文字轉語音的功能，需求也比較簡單，就是將一段報警信息通過語音的方式播放出來，之前一直採用CS客戶端，利用微軟自帶的Speech語音播放庫就可以完成， 1.1 封裝winSpedk類代碼如下： namespace Speak { using System; using System ...
轉：我只是下了個訂單，鬼知道我在微服務里經歷了什麼？

當我傻啊，用戶在電商網站購買成功，還在微服務中，那肯定就是有一套微服務架構的電商系統。設計一套電商系統還不簡單簡單想象一下，既然是一個電商系統，有用戶去購買，就肯定得有一個用戶模塊，購買什麼東西總不是西北風吧，購買肯定是商品吧，省掉購物車，就得有商品模塊吧，商品總得有庫存吧，庫存就暫時跟商品放一 ...
C#在txt類文件中追加內容

string path = "test.txt"; FileStream mystream = new FileStream(path, FileMode.OpenOrCreate); StreamWriter myWrite = new StreamWriter(mystream); myWrit ...
[目錄] ASP.Net Core 搭建微服務網站

本項目採用ASP.Net Core微服務技術，搭建博客和Saas平臺。全文將圍繞（1）設計模式（2）敏捷開發目的：結構足夠合理，代碼足夠優美，擴展性、可讀性、易維護性做到最優。以下目錄僅為整體思路，後期逐漸完善補充。 1.配置linux環境實現持續集成 2.快速搭建 ASP.net cor ...