Python 正則表達式(RegEx)指南

来源:https://www.cnblogs.com/xiaowange/archive/2023/11/02/17806510.html
-Advertisement-
Play Games

正則表達式(RegEx)是一系列字元,形成了一個搜索模式。RegEx 可用於檢查字元串是否包含指定的搜索模式。 RegEx 模塊 Python 中有一個內置的包叫做 re,它可以用於處理正則表達式。導入 re 模塊: import re Python 中的 RegEx,一旦導入了 re 模塊,您就可 ...


正則表達式(RegEx)是一系列字元,形成了一個搜索模式。RegEx 可用於檢查字元串是否包含指定的搜索模式。

RegEx 模塊

Python 中有一個內置的包叫做 re,它可以用於處理正則表達式。導入 re 模塊:

import re

Python 中的 RegEx,一旦導入了 re 模塊,您就可以開始使用正則表達式了。

示例:搜索字元串以查看它是否以 "The" 開頭並以 "Spain" 結尾:

import re

txt = "The rain in Spain"
x = re.search("^The.*Spain$", txt)

RegEx 函數

re 模塊提供了一組函數,允許我們在字元串中搜索匹配項:

函數  描述

findall  返回包含所有匹配項的列表

search  如果字元串中的任何位置存在匹配項,則返回一個 Match 對象

split  返回一個列表,其中字元串已在每個匹配項處拆分

sub  用字元串替換一個或多個匹配項

元字元

元字元是具有特殊含義的字元:

字元  描述  示例

[]  一組字元  "[a-m]"  

\  表示特殊序列(也可以用於轉義特殊字元)  "\d"  

.  任何字元(除換行符之外的任何字元)  "he..o"  

^  以...開始  "^hello"  

$  以...結束  "planet$"  

- 零次或多次出現  "he.*o"  
- 一次或多次出現  "he.+o"  

?  零次或一次出現  "he.?o"  

{}  指定次數的出現次數  "he.{2}o"  

|  要麼是...,要麼是...  "falls|stays"  

()  捕獲和分組      

特殊序列

特殊序列是一個 \ 後面跟著下麵列表中的一個字元,具有特殊含義:

字元  描述  示例

\A  如果指定的字元位於字元串的開頭,則返回一個匹配項  "\AThe"  

\b  返回指定字元在單詞的開頭或結尾的匹配項

(開頭的 "r" 確保字元串被視為“原始字元串”)  r"\bain"

r"ain\b"  

\B  返回指定字元存在但不在單詞的開頭(或結尾)的匹配項

(開頭的 "r" 確保字元串被視為“原始字元串”)  r"\Bain"

r"ain\B"  

\d  返回字元串包含數字(0-9)的匹配項  "\d"  

\D  返回字元串不包含數字的匹配項  "\D"  

\s  返回字元串包含空白字元的匹配項  "\s"  

\S  返回字元串不包含空白字元的匹配項  "\S"  

\w  返回字元串包含任何單詞字元的匹配項(從 a 到 Z,從 0 到 9,以及下劃線 _ 字元)  "\w"  

\W  返回字元串不包含任何單詞字元的匹配項  "\W"  

\Z  如果指定的字元位於字元串的末尾,則返回一個匹配項  "Spain\Z"  

集合

集合是一個放在一對方括弧 [] 中的一組字元,具有特殊含義:

集合  描述

[arn]  返回一個匹配項,其中存在指定的字元(a、r 或 n)

[a-n]  返回任何小寫字元的匹配項,字母順序在 a 和 n 之間

[^arn]  返回除 a、r 和 n 之外的任何字元的匹配項

[0123]  返回字元串中存在任何指定的數字(0、1、2 或 3)的匹配項

[0-9]  返回字元串中存在任何數字(0 到 9)的匹配項

[0-5][0-9]  返回字元串中存在任何兩位數的匹配項,介於 00 和 59 之間

[a-zA-Z]  返回任何字母字元的匹配項,字母順序在 a 到 z 之間,不區分大小寫

[+]  在集合中,+、*、.、|、()、$、{} 沒有特殊含義,因此 [+] 意味著:返回字元串中的任何 + 字元的匹配項

findall() 函數

findall() 函數返回一個包含所有匹配項的列表。

示例:列印所有匹配項的列表:

import re

txt = "The rain in Spain"
x = re.findall("ai", txt)
print(x)

該列表按照找到的順序包含匹配項。如果沒有找到匹配項,則返回一個空列表:

示例:如果未找到匹配項,則返回一個空列表:

import re

txt = "The rain in Spain"
x = re.findall("Portugal", txt)
print(x)

search() 函數

search() 函數在字元串中搜索匹配項,如果有匹配項,則返回一個 Match 對象。如果有多個匹配項,只會返回第一個匹配項:

示例:搜索字元串中的第一個空格字元:

import re

txt = "The rain in Spain"
x = re.search("\s", txt)

print("第一個空格字元位於位置:", x.start())

如果沒有找到匹配項,則返回值為 None:

示例:進行一個不會返回匹配項的搜索:

import re

txt = "The rain in Spain"
x = re.search("Portugal", txt)
print(x)

split() 函數

split() 函數返回一個列表,其中字元串已在每個匹配項處拆分:

示例:在每個空格字元處拆分:

import re

txt = "The rain in Spain"
x = re.split("\s", txt)
print(x)

您可以通過指定 maxsplit 參數來控制出現的次數:

示例:僅在第一個匹配項處拆分字元串:

import re

txt = "The rain in Spain"
x = re.split("\s", txt, 1)
print(x)

sub() 函數

sub() 函數用您選擇的文本替換匹配項:

示例:用數字 9 替換每個空格字元:

import re

txt = "The rain in Spain"
x = re.sub("\s", "9", txt)
print(x)

您可以通過指定 count 參數來控制替換的次數:

示例:替換前兩個匹配項:

import re

txt = "The rain in Spain"
x = re.sub("\s", "9", txt, 2)
print(x)

Match 對象

Match 對象是一個包含有關搜索和結果的信息的對象。

註意:如果沒有匹配項,將返回值 None,而不是 Match 對象。

示例:執行一個將返回 Match 對象的搜索:

import re

txt = "The rain in Spain"
x = re.search("ai", txt)
print(x)  # 這將列印一個對象

Match 對象具有屬性和方法,用於檢索有關搜索和結果的信息:

  • .span() 返回一個包含匹配項的起始位置和結束位置的元組。
  • .string 返回傳遞給函數的字元串。
  • .group() 返回字元串中存在匹配項的部分。

示例:列印第一個匹配項的位置(起始位置和結束位置)。正則表達式查找以大寫字母 "S" 開頭的任何單詞:

import re

txt = "The rain in Spain"
x = re.search(r"\bS\w+", txt)
print(x.span())

示例:列印傳遞給函數的字元串:

import re

txt = "The rain in Spain"
x = re.search(r"\bS\w+", txt)
print(x.string)

示例:列印存在匹配項的字元串部分。正則表達式查找以大寫字母 "S" 開頭的任何單詞:

import re

txt = "The rain in Spain"
x = re.search(r"\bS\w+", txt)
print(x.group())

最後

為了方便其他設備和平臺的小伙伴觀看往期文章:公眾號搜索Let us Coding,或者掃描下方二維碼,關註公眾號,即可獲取最新文章。

看完如果覺得有幫助,歡迎點贊、收藏關註

image


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 效果演示 橫版 豎版 思路分析 可以看到文字是一段一段的並且獨占一行,使用段落標簽p表示一行 一段文字內,字是一個一個顯示的,所以這裡每一個字都用一個span標簽裝起來 每一個字都是從透明到不透明的過渡效果,使用css3的過渡屬性tran ...
  • vue3.0父級組件調用子組件方法 場景:在頁面開發過程中,我經常涉及到不同組件之間的元素和方法的調用。就此記錄在vue3.0項目,也是我開發的開源項目中的實現方式。 父級組件調用子級 1.應用場景 以下以我的代碼實現為例:在左側菜單中,通過點擊新建會話,在會話列表中新建一個會話框。 其中:會話列表 ...
  • 前言 之前業務系統中驗證碼一直是由後端返回base64與一個驗證碼的字元串來實現的,想了下,前端其實可以直接canvas實現,減輕伺服器壓力。 實現 子組件,允許自定義圖片尺寸(預設尺寸為100 * 40)與驗證碼刷新時間(預設時間為60秒)。同時暴露繪製驗證碼方法drawPic(),允許父組件直接 ...
  • 公眾號「古時的風箏」,專註於後端技術,尤其是 Java 及周邊生態。 個人博客:www.moonkite.cn 大家好,我是風箏 最近這兩天,在前端圈最火的圖片莫過於下麵這張了。 這是一段 React 代碼,就算你完全沒用過 React 也沒關係,一眼看過去就能看到其中最敏感的一句代碼,就是那句 S ...
  • 1、什麼是for迴圈 在JavaScript中,for迴圈是一種常用的控制流語句,用於重覆執行一段代碼指定的次數。 for (迴圈變數初始化表達式; 迴圈條件表達式; 更新迴圈變數表達式) { 迴圈體} 初始化表達式:只在迴圈開始時執行一次,通常用於初始化迴圈控制變數。 條件表達式:每次迴圈開始前都 ...
  • 退款業務強耦合到售後系統中,並且業務代碼分散到各個業務層,嚴重缺乏系統的領域邊界和分層設計,重構後退款業務邏輯不強依賴售後核心業務邏輯,做到可以獨立部署。 ...
  • OpenKey.Cloud 作為 ChatGPT 生態圈內的重要基礎設施,提供官方 API 的轉發,長久以來一直保持著高穩定性,這是如何做到的?今天就來揭秘 OpenKey 系統的詳細架構圖。 ...
  • 前言 筆者在大學下屬的事業單位上班,最近去幫著帶下操作系統的實驗課,這裡隨手水點參考代碼,歡迎各位領導老師蒞臨指正 實驗目標 編寫一個簡單的進程調度器 實驗內容 進程式控制制塊(PCB)的定義與管理 進程調度演算法的實現 進程創建、銷毀和切換 給定一批進程對比3-4種調度演算法的時間(自選演算法) 實驗參考答 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...