python 正則表達式 (re模塊)

来源:https://www.cnblogs.com/huanyue123/archive/2018/11/17/9973943.html
-Advertisement-
Play Games

re.match函數 re.match 嘗試從字元串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。 函數語法 參數說明: pattern 要匹配的正則表達式string 要匹配的字元串flags 標誌位,用於控制正則表達式的匹配方式,例如,是否要區分大小寫等等, ...


re.match函數

re.match 嘗試從字元串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。

函數語法

re.match(pattern, string, flags=0)

參數說明:

pattern  要匹配的正則表達式
string    要匹配的字元串
flags     標誌位,用於控制正則表達式的匹配方式,例如,是否要區分大小寫等等,參考正則表達式修飾符

實例

import re
print(re.match('abc','abcdefghi').span())   #在起始位置匹配
print(re.match('ghi','abcdefghi'))          #不在起始位置匹配

運行結果

(0, 3)
None

 re.search方法

re.search 掃描整個字元串並返回第一個成功匹配。

函數語法

re.search(pattern, string, flags=0)

實例

import re
print(re.search('abc','abcdefghi').span())    #在起始位置匹配
print(re.search('ghi','abcdefghi').span())    #不在起始位置匹配

運行結果

(0, 3)
(6, 9)

re.match與re.search的區別:

re.match只匹配字元串的開始,如果字元串開始不符合正則表達式,則匹配失敗,函數返回None;而re.search匹配整個字元串,直到找到一個匹配。

檢索和替換

 Python 的 re 模塊提供了re.sub用於替換字元串中的匹配項。

語法

re.sub(pattern, repl, string, count=0, flags=0)

參數說明

  • pattern : 正則中的模式字元串。
  • repl : 替換的字元串,也可為一個函數。
  • string : 要被查找替換的原始字元串。
  • count : 模式匹配後替換的最大次數,預設 0 表示替換所有的匹配。

實例

import re
phone_number='3-123-456-789'
#將'-'替換成'@' number=re.sub('-','@',phone_number) print('修改後的電話號碼',number)

運行結果

修改後的電話號碼  3@123@456@789

repl參數是一個函數時

實例

import re
#將匹配到的數字乘3 def double(a): c=int(a.group('c')) return str(3*c) print(re.sub('(?P<c>\d+)',double,'asd-645-sa-4-da-87-ad-6'))

運行結果

asd-1935-sa-12-da-261-ad-18

compile函數

compile 函數用於編譯正則表達式,生成一個正則表達式( Pattern )對象,供 match() 和 search() 這兩個函數使用。

語法格式為:

re.compile(pattern, [flags])

實例

import re
pattern = re.compile(r'\d+')
a = pattern.match('one12twothree34four',3,10)   #從 1 開始查找
print(f'{a.group(),a.span()}')
b = pattern.search('one12twothree34four', 5, 15)#從 t 開始搜索
print(f'{b.group(),b.span()}')

運行結果

('12', (3, 5))
('34', (13, 15))

findall

在字元串中找到正則表達式所匹配的所有子串,並返回一個列表,如果沒有找到匹配的,則返回空列表。

註意: match 和 search 是匹配一次 findall 匹配所有。

語法格式

findall(pattern, string, flags=0)

實例

import re
reg='\d+'
print(re.findall(reg,'1a2b3c4d5e6f7g'))

運行結果

['1', '2', '3', '4', '5', '6', '7']

split

split 方法按照能夠匹配的子串將字元串分割後返回列表

語法格式

re.split(pattern, string, maxsplit, flags)

參數

maxsplite  分割次數,maxsplit=1即分割一次,預設為0,不限制次數

 

實例

import re
Str='1a2b3c4d5e6d7f'
print(re.split('[a-z]',Str))

運行結果

['1', '2', '3', '4', '5', '6', '7', '']

正則表達式對象

re.MatchObject

group() 返回被 RE 匹配的字元串。

  • start() 返回匹配開始的位置
  • end() 返回匹配結束的位置
  • span() 返回一個元組包含匹配 (開始,結束) 的位置

正則表達式修飾符 (flags)

修飾符描述
re.I 使匹配對大小寫不敏感
re.L 做本地化識別(locale-aware)匹配
re.M 多行匹配,影響 ^ 和 $
re.S 使 . 匹配包括換行在內的所有字元
re.U 根據Unicode字元集解析字元。這個標誌影響 \w, \W, \b, \B.
re.X 該標誌通過給予你更靈活的格式以便你將正則表達式寫得更易於理解。

 

正則表達式常用字元含義

普通字元 匹配自身
 .  預設匹配除\n之外的任意一個字元,若指定flag DOTALL,則匹配任意字元包括換行
 ^  匹配字元開頭,若指定flags MULTILINE,這種也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
 $  匹配字元結尾或e.search(r"^a","\nabc\neee",flags=re.MULTILINE).group()也可以
 *  匹配*號前的字元0次或多次re.findall("ab*","cabb3abcbbac")  結果為['abb', 'ab', 'a'] 
 +  匹配前一個字元1次或多次re.findall("ab+","ab+cd+abb+bba") 結果['ab', 'abb']
 ?  匹配前一個字元1次或0次
 {m}  匹配前一個字元m次
{n,m}   匹配前一個字元n到m次re.findall("ab{1,3}","abb abc abbcbbb") 結果'abb', 'ab', 'abb'] 
 |  匹配|左或|右的字元re.search("abc|ABC","ABCBabcCD").group() 結果'ABC' 
 (...)  分組匹配re.search("(abc){2}a(123|456)c", "abcabca456c").group() 結果 abcabca456c
 [...]  字元集,對應位置可以是字元集中的任意字元,字元集中的字元可以逐個給出也可以給出範圍,如[a-c]即[abc],[^abc]b表示取反即非abc
\A 只從字元開頭匹配re.search("\Aabc","alexabc") 是匹配不到的
\Z 匹配字元結尾同$
\d 匹配數字0-9
\w 匹配[A-Za-z0-9]
\D 匹配非數字
\W 匹配非[A-Za-z0-9]
\s 匹配空白字元、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 結果為 '\t'

 

反斜杠作用:

  • 反斜杠後邊跟元字元去除特殊功能;(即將特殊字元轉義成普通字元)
  • 反斜杠後邊跟普通字元實現特殊功能;(即預定義字元)
  • 引用序號對應的字組所匹配的字元串。

 

萌新第一次發博客,坐等大佬點評


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 首先給大家推薦幾個網頁: http://www.mybatis.cn/ http://blog.csdn.net/isea533/article/category/2092001 http://www.mybatis.org/mybatis-3/zh/index.html http://www.my ...
  • //需先建立student.txt文件#include #include #include #include #include using namespace std; #define OK 1 #define ERROR 0 #define OVERFLOW -1 #define List_INI... ...
  • 在做web開發的時候,過濾器(Filter)和攔截器(Interceptor)很常見,通俗的講,過濾器可以簡單理解為“取你所想取”,忽視掉那些你不想要的東西;攔截器可以簡單理解為“拒你所想拒”,關心你想要拒絕掉哪些東西,比如一個BBS論壇上攔截掉敏感辭彙。依賴於servlet容器,是JavaEE標準... ...
  • 函數在python中作為一等函數,具有以下特點: 1、可以作為參數傳遞給其他函數 2、作為其他函數的值返回 3、能賦值給變數或數據結構中的元素 4、在運行的時候創建 In [1]: def add(x,y): ...: return x+y ...:In [2]: new_add=addIn [3] ...
  • 一、序列化 在存儲數據或者網路傳輸數據的時候,需要對對象進行處理。把對象處理成方便存儲和傳輸的數據格式。這個過程叫序列化。 不同的序列化,結果也不同,但目的是一樣的。都是為了存儲和傳輸。 在python中存在三種序列化的方案: pickle:可將python中的任意數據類型轉化成bytes並寫入到文 ...
  • 介紹: 1 Maven是用來管理jar包的一種工具, 2 Maven主要是構建java項目和java web項目 3 maven項目管理所依賴的jar包不需要手動向工程添加jar包,只需要在pom.xml(maven工程的配置文件)添加jar包的坐標,自動從maven倉庫中下載 jar包、運行 第一 ...
  • 全局光照這個名詞在電腦圖形學里已經不算一個新名詞了,現在一提到擬真度,很多人基本上都會去想到全局光照,這個名詞上世紀七八十年代就有了,好像是由一個叫Jim Kajiya的大神在他那篇已經被引用了不知道多少次的論文里《The Rendering Equation》里提出來的,現在很多全局光照演算法基本 ...
  • Django中,與資料庫相關的模塊是model模塊,它提供了一種簡單易操作的API方式與資料庫交互,它是通過ORM映射的方式來操作資料庫,一個類對應資料庫一張表,一個類屬性,對應該表的一個欄位,一個實例化的類對象就是一個表中的一行數據信息。在開發的階段,工程師只需要python語言本身進行代碼設計, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...