python 正則表達式 (re模塊)_ZenDei技術網路在線

python 正則表達式 (re模塊)

-Advertisement-

re.match函數 re.match 嘗試從字元串的起始位置匹配一個模式，如果不是起始位置匹配成功的話，match()就返回none。函數語法參數說明: pattern 要匹配的正則表達式string 要匹配的字元串flags 標誌位,用於控制正則表達式的匹配方式,例如,是否要區分大小寫等等, ...

re.match函數

re.match 嘗試從字元串的起始位置匹配一個模式，如果不是起始位置匹配成功的話，match()就返回none。

函數語法

re.match(pattern, string, flags=0)

參數說明:

pattern　　要匹配的正則表達式
string　　要匹配的字元串
flags　　標誌位,用於控制正則表達式的匹配方式,例如,是否要區分大小寫等等,參考正則表達式修飾符

實例

import re
print(re.match('abc','abcdefghi').span())   #在起始位置匹配
print(re.match('ghi','abcdefghi'))          #不在起始位置匹配

運行結果

(0, 3)
None

re.search方法

re.search 掃描整個字元串並返回第一個成功匹配。

函數語法

re.search(pattern, string, flags=0)

實例

import re
print(re.search('abc','abcdefghi').span())　　　　#在起始位置匹配
print(re.search('ghi','abcdefghi').span())　　　　#不在起始位置匹配

運行結果

(0, 3)
(6, 9)

re.match與re.search的區別:

re.match只匹配字元串的開始，如果字元串開始不符合正則表達式，則匹配失敗，函數返回None；而re.search匹配整個字元串，直到找到一個匹配。

檢索和替換

Python 的 re 模塊提供了re.sub用於替換字元串中的匹配項。

語法

re.sub(pattern, repl, string, count=0, flags=0)

參數說明

pattern : 正則中的模式字元串。
repl : 替換的字元串，也可為一個函數。
string : 要被查找替換的原始字元串。
count : 模式匹配後替換的最大次數，預設 0 表示替換所有的匹配。

實例

import re
phone_number='3-123-456-789'
#將'-'替換成'@'
number=re.sub('-','@',phone_number)
print('修改後的電話號碼',number)

運行結果

修改後的電話號碼  3@123@456@789

repl參數是一個函數時

實例

import re
#將匹配到的數字乘3
def double(a):
    c=int(a.group('c'))
    return str(3*c)
print(re.sub('(?P<c>\d+)',double,'asd-645-sa-4-da-87-ad-6'))

運行結果

asd-1935-sa-12-da-261-ad-18

compile函數

compile 函數用於編譯正則表達式，生成一個正則表達式（ Pattern ）對象，供 match() 和 search() 這兩個函數使用。

語法格式為：

re.compile(pattern, [flags])

實例

import re
pattern = re.compile(r'\d+')
a = pattern.match('one12twothree34four',3,10)   #從 1 開始查找
print(f'{a.group(),a.span()}')
b = pattern.search('one12twothree34four', 5, 15)#從 t 開始搜索
print(f'{b.group(),b.span()}')

運行結果

('12', (3, 5))
('34', (13, 15))

findall

在字元串中找到正則表達式所匹配的所有子串，並返回一個列表，如果沒有找到匹配的，則返回空列表。

註意： match 和 search 是匹配一次 findall 匹配所有。

語法格式

findall(pattern, string, flags=0)

實例

import re
reg='\d+'
print(re.findall(reg,'1a2b3c4d5e6f7g'))

運行結果

['1', '2', '3', '4', '5', '6', '7']

split

split 方法按照能夠匹配的子串將字元串分割後返回列表

語法格式

re.split(pattern, string, maxsplit, flags)

參數

maxsplite

分割次數,maxsplit=1即分割一次,預設為0,不限制次數

實例

import re
Str='1a2b3c4d5e6d7f'
print(re.split('[a-z]',Str))

運行結果

['1', '2', '3', '4', '5', '6', '7', '']

正則表達式對象

re.MatchObject

group() 返回被 RE 匹配的字元串。

start() 返回匹配開始的位置
end() 返回匹配結束的位置
span() 返回一個元組包含匹配 (開始,結束) 的位置

正則表達式修飾符 (flags)

修飾符	描述
re.I	使匹配對大小寫不敏感
re.L	做本地化識別（locale-aware）匹配
re.M	多行匹配，影響 ^ 和 $
re.S	使 . 匹配包括換行在內的所有字元
re.U	根據Unicode字元集解析字元。這個標誌影響 \w, \W, \b, \B.
re.X	該標誌通過給予你更靈活的格式以便你將正則表達式寫得更易於理解。

正則表達式常用字元含義

普通字元	匹配自身
.	預設匹配除\n之外的任意一個字元,若指定flag DOTALL,則匹配任意字元包括換行
^	匹配字元開頭,若指定flags MULTILINE,這種也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
$	匹配字元結尾或e.search(r"^a","\nabc\neee",flags=re.MULTILINE).group()也可以
*	匹配號前的字元0次或多次re.findall("ab","cabb3abcbbac") 結果為['abb', 'ab', 'a']
+	匹配前一個字元1次或多次re.findall("ab+","ab+cd+abb+bba") 結果['ab', 'abb']
?	匹配前一個字元1次或0次
{m}	匹配前一個字元m次
{n,m}	匹配前一個字元n到m次re.findall("ab{1,3}","abb abc abbcbbb") 結果'abb', 'ab', 'abb']
\|	匹配\|左或\|右的字元re.search("abc\|ABC","ABCBabcCD").group() 結果'ABC'
(...)	分組匹配re.search("(abc){2}a(123\|456)c", "abcabca456c").group() 結果 abcabca456c
[...]	字元集,對應位置可以是字元集中的任意字元,字元集中的字元可以逐個給出也可以給出範圍,如[a-c]即[abc],[^abc]b表示取反即非abc
\A	只從字元開頭匹配re.search("\Aabc","alexabc") 是匹配不到的
\Z	匹配字元結尾同$
\d	匹配數字0-9
\w	匹配[A-Za-z0-9]
\D	匹配非數字
\W	匹配非[A-Za-z0-9]
\s	匹配空白字元、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 結果為 '\t'

反斜杠作用:

反斜杠後邊跟元字元去除特殊功能；（即將特殊字元轉義成普通字元）
反斜杠後邊跟普通字元實現特殊功能；（即預定義字元）
引用序號對應的字組所匹配的字元串。

萌新第一次發博客,坐等大佬點評

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

MyBatis學習筆記（一）入門

首先給大家推薦幾個網頁： http://www.mybatis.cn/ http://blog.csdn.net/isea533/article/category/2092001 http://www.mybatis.org/mybatis-3/zh/index.html http://www.my ...
學生選題信息管理系統

//需先建立student.txt文件#include #include #include #include #include using namespace std; #define OK 1 #define ERROR 0 #define OVERFLOW -1 #define List_INI... ...
SpringBoot(十一)過濾器和攔截器

在做web開發的時候，過濾器（Filter）和攔截器（Interceptor）很常見，通俗的講，過濾器可以簡單理解為“取你所想取”，忽視掉那些你不想要的東西；攔截器可以簡單理解為“拒你所想拒”，關心你想要拒絕掉哪些東西，比如一個BBS論壇上攔截掉敏感辭彙。依賴於servlet容器,是JavaEE標準... ...
python技巧一等函數

函數在python中作為一等函數,具有以下特點: 1、可以作為參數傳遞給其他函數 2、作為其他函數的值返回 3、能賦值給變數或數據結構中的元素 4、在運行的時候創建 In [1]: def add(x,y): ...: return x+y ...:In [2]: new_add=addIn [3] ...
pickle

一、序列化在存儲數據或者網路傳輸數據的時候，需要對對象進行處理。把對象處理成方便存儲和傳輸的數據格式。這個過程叫序列化。不同的序列化，結果也不同，但目的是一樣的。都是為了存儲和傳輸。在python中存在三種序列化的方案： pickle：可將python中的任意數據類型轉化成bytes並寫入到文 ...
idea部署Maven入門（一）——環境變數的配置和下載

介紹： 1 Maven是用來管理jar包的一種工具， 2 Maven主要是構建java項目和java web項目 3 maven項目管理所依賴的jar包不需要手動向工程添加jar包，只需要在pom.xml（maven工程的配置文件）添加jar包的坐標，自動從maven倉庫中下載 jar包、運行第一 ...
一步一步實現基於GPU的pathtracer（三）：path tracing 簡述

全局光照這個名詞在電腦圖形學里已經不算一個新名詞了，現在一提到擬真度，很多人基本上都會去想到全局光照，這個名詞上世紀七八十年代就有了，好像是由一個叫Jim Kajiya的大神在他那篇已經被引用了不知道多少次的論文里《The Rendering Equation》里提出來的，現在很多全局光照演算法基本 ...
Django之model模塊創建表完整過程

Django中，與資料庫相關的模塊是model模塊，它提供了一種簡單易操作的API方式與資料庫交互，它是通過ORM映射的方式來操作資料庫，一個類對應資料庫一張表，一個類屬性，對應該表的一個欄位，一個實例化的類對象就是一個表中的一行數據信息。在開發的階段，工程師只需要python語言本身進行代碼設計， ...