python正則表達式3-模式匹配

来源:https://www.cnblogs.com/ghostwu/archive/2018/03/23/8634449.html
-Advertisement-
Play Games

re.S,使 '.' 匹配換行在內的所有字元 re.M,多行匹配,主要影響( ^和$ ) 當正則有多行的時候,可以開啟verbose模式re.X ():分組與| 的使用, 假如我們要匹配一個.com,.cn,.net結尾的email 匹配超鏈接 ...


re.S,使 '.'  匹配換行在內的所有字元

>>> pattern=r'ghostwu.com'
>>> import re
>>> re.findall( pattern, 'ghostwuacom' )
['ghostwuacom']
>>> re.findall( pattern, 'ghostwubcom' ) 
['ghostwubcom']
>>> re.findall( pattern, 'ghostwu.com' ) 
['ghostwu.com']
>>> re.findall( pattern, 'ghostwu\ncom' ) 
[]
>>> re.findall( pattern, 'ghostwu\ncom', re.S )
['ghostwu\ncom']
>>> 

re.M,多行匹配,主要影響( ^和$ )

>>> str="""
... hi,ghostwu,how are you
... ghostwu: my name is ghostwu,how are you
... ghostwu: nice to meet you
... hello ghostwu
... """
>>> pattern = r"^ghostwu"
>>> re.findall( pattern, str )
[]
>>> re.findall( pattern, str, re.M )
['ghostwu', 'ghostwu']
>>> 

當正則有多行的時候,可以開啟verbose模式re.X

>>> pattern=r"""
... \d{3,4}
... -?
... \d{8}
... """
>>> str="020-88888888"
>>> re.findall( pattern, str )
[]
>>> re.findall( pattern, str, re.X )
['020-88888888']
>>> 

():分組與|  的使用,  假如我們要匹配一個.com,.cn,.net結尾的email

>>> pattern=r"\w+@\w+(.com|.cn|.net)"
>>> email="[email protected]">>> re.match( pattern, email )
<_sre.SRE_Match object at 0x7f2b74481828>
>>> re.match( pattern, '[email protected]' )
<_sre.SRE_Match object at 0x7f2b744818a0>
>>> re.match( pattern, '[email protected]' )
<_sre.SRE_Match object at 0x7f2b74481828>
>>> re.match( pattern, '[email protected]' )
>>> 

匹配超鏈接

>>> html="""
... <a href="http://www.baidu.com">百度</a>
... <a href="index.html">首頁</a>
... <p>這是一段說明</p>
... <a href="http://www.taobao.com">淘寶</a>
... """
>>> re=r"href=\"(.+?)\""
>>> pattern=r"href=\"(.+?)\""
>>> re
'href=\\"(.+?)\\"'
>>> import re
>>> re.findall( pattern, html )
['http://www.baidu.com', 'index.html', 'http://www.taobao.com']
>>> 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本文內容: 抽象類 介面 抽象類與介面的異同 首發日期:2018-03-24 抽象類: 雖然已經有了父類,但有時候父類也是無法直接描述某些共有屬性的,比如哺乳類和人類都會叫,而一般來說哺乳類這個父類並沒有準確定義“叫”的屬性的,顯然應該由子類來決定怎麼“叫”,但“叫”這個屬性是共有的,那麼可以把這個 ...
  • Java long數據類型 位有符號的Java原始數據類型。當對整數的計算結果可能超出int數據類型的範圍時使用。 位有符號的Java原始數據類型。當對整數的計算結果可能超出int數據類型的範圍時使用。 long數據類型範圍是-9,223,372,036,854,775,808至9,223,372, ...
  • 從這篇文章開始,來記錄我的Django學習過程。 Day-1 一 首先是安裝Django版本的選擇,我所選擇的是Django1.11。為什麼選擇1.11呢,因為它是長期技術支持版(LTS),官方會加上新特性,和修複一些BUG。 好了,版本選擇好了,該安裝了,在我這兒安裝有兩種方法: 1. 打開CMD ...
  • 首先回憶下以前學的函數重載 函數重載 函數重載的本質為相互獨立的不同函數 通過函數名和函數參數來確定函數調用 無法直接通過函數名得到重載函數的入口地址 函數重載必然發生在同一個作用域中 類中的函數重載 靜態成員函數能與普通成員函數建立重載關係 全局函數和成員函數不能構成重載關係 操作符重載(oper ...
  • 二叉樹作為的基本數據結構,應用廣泛,在生活中處處可見,而遍歷二叉樹在二叉樹應用中十分常見。與線性存儲結構不同,二叉樹每個節點都有可能有兩棵子樹,從二叉樹的存儲結構可知: 根節點、左子樹、右子樹——二叉樹的基本組成單位。那麼,根據的遞歸的思想(數據結構嚴蔚敏版):當一個複雜的問題可以分解成若幹子問題來 ...
  • 對象模型示例: ![][1] 繼承映射的實現方式有以下三種: (一)每棵類繼承樹一張表 (二)每個類一張表 (三)每個子類一張表 (一)每棵類繼承樹一張表 關係模型如下: ![][2] 映射文件如下: 說明: 因為類繼承樹肯定是對應多個類,要把多個類的信息存放在一張表中,必須有某種機制來區分哪些記錄 ...
  • 最近項目中有個需求,需要從一個List中,抽取其中一個項目,生成一個新的List。下麵是實現代碼。 method = (tClass.newInstance()).getClass().getMethod(methodName); 有一點需要註意取得方法名的時候,需要先生成T的一個實例,tClass ...
  • Netty是建立在NIO基礎之上,Netty在NIO之上又提供了更高層次的抽象。 在Netty裡面,Accept連接可以使用單獨的線程池去處理,讀寫操作又是另外的線程池來處理。 Accept連接和讀寫操作也可以使用同一個線程池來進行處理。而請求處理邏輯既可以使用單獨的線程池進行處理,也可以跟放在讀寫 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...