正則表達式初探

来源:https://www.cnblogs.com/xyh9039/archive/2019/11/01/11780032.html
-Advertisement-
Play Games

本章主要想和大家分享下正則表達式的一些基礎用法,希望能夠對一些小白有所幫助,也為了防止自己以後遺忘相關知識點。 ...


本章主要想和大家分享下正則表達式的一些基礎用法,希望能夠對一些小白有所幫助,也為了防止自己以後遺忘相關知識點,下麵我們正式進入主題。

一、正則表達式

  1、正則表達式是由普通字元(例如字元 a 到 z)以及特殊字元(稱為元字元)組成的文字模式。
  2、正則表達式作為一個模板,將某個字元模式與所搜索的字元串進行匹配。
  3、在編寫處理字元串的程式或網頁時,經常會有查找或替換符合某些複雜規則的字元串的需要。
  4、正則表達式就是記錄文本規則的代碼。

  作用:
    1、查找數據
    2、替換數據

  正則表達式能做什麼(字元串的匹配、字元串的提取、字元串的替換

二、正則表達式的構成

  1、普通字元

    這包括所有的大小寫字母字元,所有數字,所有標點符號以及一些特殊符號。
    例如:Hello world xyh666

  2、定義字元集(取值範圍(該點都是匹配單個字元,要想匹配字元串需要結合限定符來實現)
    [a-e] 表示a到e這些字元中的某一個字元
    [aeiou] 表示aeiou這5個字元其中的某一個字元
    [a-zA-Z] 表示大寫、小寫字母中的某一個字元
    [0-9] 表示0到9之間某一個數字

    代表非
    [^lsjd]  :不是中括弧中的任意一個字元
    [^a-f]  :a-f範圍外的任意一個字元

  3、組合字元(大寫表示非)(該點都是匹配單個字元,要想匹配字元串需要結合限定符來實現)

    \d  :匹配一個數字字元。等價於[0-9]。
    \D  :匹配一個非數字字元。等價於[^0-9]。
    \w  :匹配一個字母或一個數字或一個下劃線或一個漢字。
    \W  :匹配一個非字母、非數字、非下劃線和非漢字的字元。
    \s  :匹配一個任意的空白符,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。
    \S  :匹配任意一個非空白符。等價於[^ \f\n\r\t\v]。
    \b  :匹配單詞的開始或結束的位置。
    \B  :匹配不是單詞開頭或結束的位置。

  4、特殊字元

    $  :表示字元串的結尾位置(以什麼結尾)
     :表示字元串的開始位置(以什麼開始)(在取值範圍中還表示非)
     :一個點表示匹配一個除換行符 \n之外的任何單字元(匹配單個字元,要想匹配字元串需要結合限定符來實現)
    或者的意思,指明兩項之間的一個選擇 與[...]類似
     :這個符號是用來轉義
    ( ) 分組,標記一個子表達式的開始和結束位置

  5、常用限定符
    =================匹配次數=================
    {m}  :其前一單元嚴格出現m次(重覆m次)
    {m,}  :其前一單元出現至少m次(重覆m次或更多次)
    {m,n}  :其前一單元出現至少m次,最多n次(重覆m到n次)
    =======================================
    =================多次匹配=================
      :其前面那個單元出現0次或任意次數(重覆零次或更多次)
      : 其前面那個單元出現1次或1次以上 至少匹配一次(重覆一次或更多次)
    ?  : 其前面那個單元出現0次或1次(重覆零次或一次)懶惰匹配(儘可能短匹配)
    =======================================
  6、貪婪與懶惰(貪婪模式和非貪婪模式)(儘可能長匹配和儘可能短匹配)
    *? 重覆任意次,但儘可能少重覆
    +? 重覆1次或更多次,但儘可能少重覆
    ?? 重覆0次或1次,但儘可能少重覆
    {n,m}? 重覆n到m次,但儘可能少重覆
    {n,}? 重覆n次以上,但儘可能少重覆

  7、分組

    當用()定義了一個正則表達式組後,正則引擎則會把被匹配的組按照順序編號,存入緩存。

    預設情況下,每個分組會自動擁有一個組號,規則是:從左向右,以分組的左括弧為標誌,第一個出現的分組的組號為1,第二個為2,以此類推。

    我們可以通過“\數字”的方式進行引用已經存入緩存的組。\1引用第一個匹配的組,\2引用第二個組,以此類推。

    括弧內的內容會被當成一個整體進行匹配。

  8、非獲取匹配和預查

    非獲取匹配:是指正則引擎不會把被匹配的組存入緩存,我們也無法通過“\數字”的方式進行引用我們的組。

    預查:預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始。(即用來預查的表達式字元串不會被消耗

    (?:pattern) 非獲取匹配,匹配pattern但不獲取匹配結果,不進行存儲供以後使用。這在使用或字元“(|)”來組合一個模式的各個部分時很有用。例如“industr(?:y|ies)”就是一個比“industry|industries”更簡略的表達式。

    (?=pattern) 非獲取匹配,正向肯定預查,在任何匹配pattern的字元串開始處匹配查找字元串,該匹配不需要獲取供以後使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始。

    (?!pattern) 非獲取匹配,正向否定預查,在任何不匹配pattern的字元串開始處匹配查找字元串,該匹配不需要獲取供以後使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。

    (?<=pattern) 非獲取匹配,反向肯定預查,與正向肯定預查類似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。

    (?<!patte_n) 非獲取匹配,反向否定預查,與正向否定預查類似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。

三、C#代碼調用正則表達式

    命名空間 System.Text.RegularExpressions
    
    1new Regex(正則表達式).IsMatch(要匹配的字元串)   返回bool
    2、Regex.Match
        Match match = Regex.Match("age=30", @"^(.+)=(.+)$");
        if (match.Success)
        {
            Console.WriteLine(match.Groups[0].Value);//第0組 輸出完整的字元串 age=30
            Console.WriteLine(match.Groups[1].Value);//第1組 age
            Console.WriteLine(match.Groups[2].Value);//第2組 30
        }
    3、Regex.Matches
        StringBuilder sb = new StringBuilder();
        sb.Append("<Name>張三</Name>\r\n<Name>李四</Name>\r\n<Name>王五</Name>");

        MatchCollection mc = Regex.Matches(sb.ToString(), @"(?<=<Name>).*(?=</Name>)");
        foreach (Match m in mc)
        {
            Console.WriteLine(m.Value);
        }

四、示例說明

接下來針對第二大點的內容我們舉些例子來說明:

未完待續.......

 

正則表達式測試器:

鏈接:https://pan.baidu.com/s/1CwyrLH2dwbBk1KVi2FCGDw 
提取碼:nwyc

 

版權聲明:本文部分描述摘自網路,如有雷同純屬巧合,如有侵權請及時聯繫本人修改,謝謝!!!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • python基礎 一.python介紹 python的創始人為吉多·範羅蘇姆(Guido van Rossum)。1989年的聖誕節期間,吉多·範羅蘇姆為了在阿姆斯特丹打發時間,決心開發一個新的腳本解釋程式,作為ABC語言的一種繼承。 最新的TIOBE排行榜,Python已經占據世界第四名的位置, ...
  • 一、取整處理 1.int() 向下取整 內置函數 2.round() 四捨五入 內置函數 3. floor() 向下取整 math模塊函數 floor的英文釋義:地板。顧名思義也是向下取整 4.ceil()向上取整 math模塊函數 ceil的英文釋義:天花板。 5.modf() 分別取整數部分和小 ...
  • python day 20: 線程池與協程 2019/11/1 [TOC] 資料來自老男孩教育 2. 線程 線程適用於IO密集流操作,線程是最小的執行單元 線程之間數據是共用的,共用一塊記憶體 import threading :導入線程模塊 t = threading.Thread(target=f ...
  • 1. DDL相關 a. b. c. 2. 查詢表總共有多少條數據, 一般有如下3中寫法, 推薦優先使用 count(1) 或 count(id) 3. 單條插入 4. 批量插入(插入條數100條至10000條以內性能高, 具體插入條數看插入的欄位個數和欄位值的字元數, 推薦1000條) 5. 單條更 ...
  • 今天我要和大家分享的是 AOP(Aspect Oriented Programming)這個東西,名字與 OOP 僅差一個字母,其實它是對 OOP 編程方式的一種補充,並非是取而代之。翻譯過來就是“面向方面編程”,可我更傾向於翻譯為“面向切麵編程”。它聽起有些的神秘,為什麼呢?當你看完這篇文章的時候 ...
  • 想從一個序列中隨機抽取若幹元素,或者想生成幾個隨機數。 random 模塊有大量的函數用來產生隨機數和隨機選擇元素。比如,要想從一個序列中隨機的抽取一個元素,可以使用random.choice() : 為了提取出N 個不同元素的樣本用來做進一步的操作,可以使用random.sample() 如果你僅 ...
  • 一、排查思路 最直接也是最有效的辦法:看console控制台 這是我看到的原因,我先想到是不是web.xml里的url-pattern里的命名是不是衝突 因為我在這個項目之前寫了一個項目,用的是同一個tomcat,單個啟動上一個項目是沒有任何問題的,所以排除掉不是tomcat本身的問題 接下來,我在 ...
  • 本解決方案是一個Windows應用編程框架和UI庫,包括四個項目: Ligg.EasyWinForm是一個Winform應用編程框架和UI庫。通過這個該框架,不需任何代碼,通過XML配置文件,搭建任意複雜的Windows應用界面,以類似Execel公式的方式實現基本的過程式控制制(賦值、條件判斷、迴圈、 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...