Python核心編程技術之正則表達式(努力更新中)

来源:http://www.cnblogs.com/martin666/archive/2017/07/18/7202433.html
-Advertisement-
Play Games

Python編程核心技術之正則表達式(regex) 一.正則表達式簡介 正則表達式(regex)為高級的文本模式匹配、抽取、與/或文本形式的搜索和替換功能提供了基礎。簡單的來說正則表達式是一些由字元和特殊符號組成的字元串,他們描述了模式的重覆或者表述多個字元,於是正則表達式能夠按照某種模式匹配一系列 ...


Python編程核心技術之正則表達式(regex)


一.正則表達式簡介


正則表達式(regex)為高級的文本模式匹配、抽取、與/或文本形式的搜索和替換功能提供了基礎。簡單的來說正則表達式是一些由字元和特殊符號組成的字元串,他們描述了模式的重覆或者表述多個字元,於是正則表達式能夠按照某種模式匹配一系列有相似特征的字元
串。即能匹配多個字元串。在Python中通過標準庫中的re模塊來支持正則表達式。

註釋:在Python中有兩種方法完成模式匹配:搜索和匹配。搜索:通過search()函數在字元串的任意部分中搜索匹配模式。匹配:通過調用math()函數判斷一個字元串能否從起始處全部或者部分的匹配某個模式。


二.常見正則表達式符號和特殊字元


符號             說明                            正則表達式模式        匹配的字元串

literal        匹配字元串的值                     foo                 foo

|              匹配多個正則表達式模式              bat|bet|bit         bat,bet,bit

.              匹配任意一個字元(換行符\n除外)     f.o                 在f和o之間具有任何一個字元的字元串

^              匹配字元串的開始                   ^From               任何以From開始的字元串

$              匹配字元串的結尾                    end$               任何以end結束的字元串

[...]          匹配[]中的任意一個字元              b[aeiu]t            bat,bet,bit,but

[x-y]          匹配從字元x到y中的任意一個字元       [0-9][a-zA-Z]       0到9之間的任何一個數字和任何一個字母組成的字元串

[^...]         不匹配此字元集中出現的任何一個字元    [^aeiou]            一個非母音字元

*              匹配前面的正則表達式零次或多次        t[dn]*o            t和o之間有任意多個d或n組成的字元串,
                                                                    例如to,tdo,tno,tdno,tddo,tndno等

+              匹配前面的正則表達式一次或多次        t[dn]+o            t和o之間有至少一個d或n組成的字元串,
                                                                    例如tdo,tno,tdno,tddo,tndno等

?              匹配前面的正則表達式零次或一次        [dn]ot?            do,no,dot,not

{N}            匹配前面的正則表達式N次              [0-9]{16}          任何一個16位數字

{M,N}          匹配前面的正則表達式M次到N次         [0-9]{15,16}       任何一個15位或16位數字

(*|+|?|{})?    上面4個重覆匹配符號(*,+,?,{})的非貪心版本,即儘可能少的匹配消耗字元,留下儘可能多的字元給後面的模式    

()             匹配()中的正則表達式,並保存為子組    f(oo|u)bar      

三.常用的用法簡介

1.使用擇一匹配符號匹配多個正則表達式模式。
表示擇一匹配的管道符號(|),豎線。表示一個從多個模式中選擇其一的操作模式。用於分割不同的正則表達式。擇一匹配也稱作並或者邏輯或。
2.匹配任意單個字元。
點號或者句號能匹配出了換行符以外的任何字元(在Python中有一個編譯標記【S或者DOTALL】可以推翻這個限制)。
3.從字元串起始或者結尾或單詞邊界匹配。
如果要匹配字元串的開始位置,就必須要用脫字元(^)或者特殊字元\A。如果要匹配字元串的末尾位置,就要用美元符($)或者\Z。
4.特殊字元\b和\B可以用來匹配字元邊界。
\b用於匹配一個字元的邊界,任何一個以\b之後字元串開始的字元串。\B用來匹配任何包含而不以\B後字元串作為其實的字元串。
5.創建字元集。
某些時候想要匹配某些特定的字元。方括弧可以匹配一對方括弧之內的任何字元。
6.限定範圍和否定。
字元集還支持匹配指定的字元範圍。方括弧中兩個符號中間用連字元(—)連接,用於指定一個範圍。另外,如果脫字元(^)緊隨左方括弧後面,這個符號就表示不匹配給定字元集中的任何一個字元。
7.使用閉包操作符實現存在性和頻數匹配。
星號或者星號操作符(*)將匹配其左邊的正則表達式出現零個或者多次的情況。
加號操作符(+)將匹配一次或者多次出現的正則表達式。
問號操作符(?)將匹配零次或者一次出現的正則表達式。
大括弧操作符({})裡面是一對逗號分隔值。將會最精確的匹配前面正則表達式N次後者一定範圍的次數。
8.表示字元集的特殊字元。
可以用d表示任何十進位數。另一個特殊字元(\w)表示全部的字母或者數字的字元集。(\s)表示空格符這些特殊字元的大寫則表示不匹配相應的字元集。
9.使用圓括弧指定分組。
當時用正則表達式時,一對圓括弧可以實現以下任意一個功能:對正則表達式進行分組或匹配子組。

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 題目鏈接 Problem Description You are a rich person, and you think your wallet is too heavy and full now. So you want to give me some money by buying a lov ...
  • 什麼是泛型,有什麼用? 先運行下麵的代碼: 上面的代碼稍微修改下: 對比上面的代碼,沒加入泛型的時候,在程式運行期才發現問題,而加入了泛型則在程式編譯期就發現了,這就是泛型的優勢所在。 在第二段代碼中,泛型就好象是在告訴編譯器:這裡聲明的變數c只跟Date類型進行比較,如果跟別的類型比較,那麼就不能 ...
  • Description osu 是一款群眾喜聞樂見的休閑軟體。 我們可以把osu的規則簡化與改編成以下的樣子: 一共有n次操作,每次操作只有成功與失敗之分,成功對應1,失敗對應0,n次操作對應為1個長度為n的01串。在這個串中連續的 X個1可以貢獻X^3 的分數,這x個1不能被其他連續的1所包含(也 ...
  • 轉自:http://blog.csdn.net/xiaoyusmile/article/details/5420252 1. 變數的定義、聲明 變數的聲明有兩種情況: 一種是需要建立存儲空間的。例如:int a。在聲明的時候就已經建立了存儲空間。這種聲明是"定義性聲明(defining declar ...
  • 自學到java的異常時,有一些自己的理解,現在總結一下。 1.為什麼要使用異常 剛開始估計很多初學者和我一樣,不理解為什麼要異常,什麼throws拋出異常,還要catch接住好麻煩的樣子,通過一個簡單的例子來理解一下。 這裡只是一個簡單的異常條件,園的半徑不可能小於等於0的,如果直接用if判斷然後處 ...
  • 前面我們分析了vector,這篇介紹STL中另一個重要的容器list list的設計 list由三部分構成:list節點、list迭代器、list本身 list節點 list是一個雙向鏈表,所以其list節點中有前後兩個指針。如下: list迭代器 前面我們說過vector是利用其記憶體分配類型成員給 ...
  • 原文鏈接:https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247487055&idx=2&sn=ca0fe8740b78deb208c82eea73d56b37 誰會成為AI 和大數據時代的第一開發語言?這本已是一個不需要爭論的問題。如果 ...
  • 原文鏈接 http://www.envicloud.cn/pages/news/418.html 4 前段時間,ThoughtWorks在深圳舉辦一次社區活動上,有一個演講主題叫做“Fullstack JavaScript”,是關於用JavaScript進行前端、伺服器端,甚至資料庫(MongoDB ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...