正則表達式模式修飾符

来源:http://www.cnblogs.com/hubqin/archive/2017/04/22/6749433.html
-Advertisement-
Play Games

下麵列出了當前可用的 PCRE 修飾符。括弧中提到的名字是 PCRE 內部這些修飾符的名稱。 模式修飾符中的空格,換行符會被忽略,其他字元會導致錯誤。 Warning This feature was DEPRECATED in PHP 5.5.0, and REMOVED as of PHP 7. ...


下麵列出了當前可用的 PCRE 修飾符。括弧中提到的名字是 PCRE 內部這些修飾符的名稱。 模式修飾符中的空格,換行符會被忽略,其他字元會導致錯誤。

 

i (PCRE_CASELESS)
如果設置了這個修飾符,模式中的字母會進行大小寫不敏感匹配。
m (PCRE_MULTILINE)
預設情況下,PCRE 認為目標字元串是由單行字元組成的(然而實際上它可能會包含多行), "行首"元字元 (^) 僅匹配字元串的開始位置, 而"行末"元字元 ($) 僅匹配字元串末尾, 或者最後的換行符(除非設置了 D 修飾符)。這個行為和 perl 相同。 當這個修飾符設置之後,“行首”和“行末”就會匹配目標字元串中任意換行符之前或之後,另外, 還分別匹配目標字元串的最開始和最末尾位置。這等同於 perl 的 /m 修飾符。如果目標字元串 中沒有 "\n" 字元,或者模式中沒有出現 ^ 或 $,設置這個修飾符不產生任何影響。
s (PCRE_DOTALL)
如果設置了這個修飾符,模式中的點號元字元匹配所有字元,包含換行符。如果沒有這個 修飾符,點號不匹配換行符。這個修飾符等同於 perl 中的/s修飾符。 一個取反字元類比如 [^a] 總是匹配換行符,而不依賴於這個修飾符的設置。
x (PCRE_EXTENDED)
如果設置了這個修飾符,模式中的沒有經過轉義的或不在字元類中的空白數據字元總會被忽略, 並且位於一個未轉義的字元類外部的#字元和下一個換行符之間的字元也被忽略。 這個修飾符 等同於 perl 中的 /x 修飾符,使被編譯模式中可以包含註釋。 註意:這僅用於數據字元。 空白字元 還是不能在模式的特殊字元序列中出現,比如序列 (?( 引入了一個條件子組(譯註: 這種語法定義的 特殊字元序列中如果出現空白字元會導致編譯錯誤。 比如(?(就會導致錯誤)。
e (PREG_REPLACE_EVAL)
Warning

This feature was DEPRECATED in PHP 5.5.0, and REMOVED as of PHP 7.0.0.

如果設置了這個被棄用的修飾符, preg_replace() 在進行了對替換字元串的 後向引用替換之後, 將替換後的字元串作為php 代碼評估執行(eval 函數方式),並使用執行結果 作為實際參與替換的字元串。單引號、雙引號、反斜線(\)和 NULL 字元在 後向引用替換時會被用反斜線轉義. Caution

The addslashes() function is run on each matched backreference before the substitution takes place. As such, when the backreference is used as a quoted string, escaped characters will be converted to literals. However, characters which are escaped, which would normally not be converted, will retain their slashes. This makes use of this modifier very complicated.

Caution

請確保 replacement 參數由合法 php 代碼字元串組成,否則 php 將會 在preg_replace() 調用的行上產生一個解釋錯誤。

Caution

不建議使用此修飾符,它很容易產生安全漏洞:

<?php
$html = $_POST['html'];

// uppercase headings
$html = preg_replace(
    '(<h([1-6])>(.*?)</h\1>)e',
    '"<h$1>" . strtoupper("$2") . "</h$1>"',
    $html
);

以上示例代碼能夠被這樣的字元串利用: <h1>{${eval($_GET[php_code])}}</h1>。 這能讓攻擊者執行他們想要的 PHP 代碼,幾乎完全滲透進伺服器。

為了阻止此類遠程代碼執行攻擊,可以使用 preg_replace_callback() 替代:

<?php
$html = $_POST['html'];

// uppercase headings
$html = preg_replace_callback(
    '(<h([1-6])>(.*?)</h\1>)',
    function ($m) {
        return "<h$m[1]>" . strtoupper($m[2]) . "</h$m[1]>";
    },
    $html
);

Note:

僅 preg_replace() 使用此修飾符,其他 PCRE 函數忽略此修飾符。

A (PCRE_ANCHORED)
如果設置了這個修飾符,模式被強製為"錨定"模式,也就是說約束匹配使其僅從 目標字元串的開始位置搜索。這個效果同樣可以使用適當的模式構造出來,並且 這也是 perl 種實現這種模式的唯一途徑。
D (PCRE_DOLLAR_ENDONLY)
如果這個修飾符被設置,模式中的元字元美元符號僅僅匹配目標字元串的末尾。如果這個修飾符 沒有設置,當字元串以一個換行符結尾時, 美元符號還會匹配該換行符(但不會匹配之前的任何換行符)。 如果設置了修飾符m,這個修飾符被忽略. 在 perl 中沒有與此修飾符等同的修飾符。
S
當一個模式需要多次使用的時候,為了得到匹配速度的提升,值得花費一些時間 對其進行一些額外的分析。如果設置了這個修飾符,這個額外的分析就會執行。當前, 這種對一個模式的分析僅僅適用於非錨定模式的匹配(即沒有單獨的固定開始字元)。
U (PCRE_UNGREEDY)
這個修飾符逆轉了量詞的"貪婪"模式。 使量詞預設為非貪婪的,通過量詞後緊跟? 的方式可以使其成為貪婪的。這和 perl 是不相容的。 它同樣可以使用 模式內修飾符設置 (?U)進行設置, 或者在量詞後以問號標記其非貪婪(比如.*?)。

Note:

在非貪婪模式,通常不能匹配超過 pcre.backtrack_limit 的字元。

X (PCRE_EXTRA)
這個修飾符打開了 PCRE 與 perl 不相容的附件功能。模式中的任意反斜線後就 ingen 一個 沒有特殊含義的字元都會導致一個錯誤,以此保留這些字元以保證向後相容性。 預設情況下,在 perl 中,反斜線緊跟一個沒有特殊含義的字元被認為是該字元的原文。 當前沒有其他特性由這個修飾符控制。
J (PCRE_INFO_JCHANGED)
內部選項設置(?J)修改本地的PCRE_DUPNAMES選項。允許子組重名, (譯註:只能通過內部選項設置,外部的 /J 設置會產生錯誤。)
u (PCRE_UTF8)
此修正符打開一個與 perl 不相容的附加功能。 模式和目標字元串都被認為是 utf-8 的。 無效的目標字元串會導致 preg_* 函數什麼都匹配不到; 無效的模式字元串會導致 E_WARNING 級別的錯誤。 PHP 5.3.4 後,5位元組和6位元組的 UTF-8 字元序列被考慮為無效(resp. PCRE 7.3 2007-08-28)。 以前就被認為是無效的 UTF-8。
轉自:http://php.net/manual/zh/reference.pcre.pattern.modifiers.php#reference.pcre.pattern.modifiers.eval

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 字元串是編程中常用的類型,字元型在記憶體中是以單個形式存儲的,比如name = "alex",在記憶體中存儲的形式為["a","l","e","x"],因此我們可以使用列表的很多功能來操作字元串,因為我開始的時候一直在想為什麼字元串可以使用切片,可以有索引,開始的時候一直不明白,後來知道了Python字 ...
  • 顯示 the import java.util cannot be resolve,如何解決?我在使用eclipse的時候, 好像無意中更改了安裝位置(workspace),現在所有的包都顯示無法導入:the import java cannot be resolved 請問如何解決這個問題? 解決 ...
  • 為什麼要學習設計模式 1、軟體開發越來越複雜,對軟體設計的要求也越來越高。而軟體設計和架構的入門功夫就是深入理解和掌握設計模式。因此,設計模式的重要性就不言而喻了。 2、設計模式已經成為軟體開發人員的“標準辭彙” 3、學習設計模式是個人提高的捷徑。為什麼這麼說呢?因為設計模式其本質是很多前輩(大牛級 ...
  • Given an array of integers, return indices of the two numbers such that they add up to a specific target. You may assume that each input would have e... ...
  • 這次的題目是這樣的: 假設有一個6*6的棋盤,每個格子裡面有一個獎品(每個獎品的價值在100到1000之間),現在要求從左上角開始到右下角結束,每次只能往右或往下走一個格子,所經過的格子里的獎品歸自己所有。問最多能收集價值多少的獎品。 最先看到這個問題的時候腦子裡面的立馬出現許多的腦洞:暴力、二叉樹 ...
  • 自動載入類 上傳代碼: ...
  • 本章介介紹了shutil,zipfile模塊的使用,我們先來認識一下這2個模塊吧。 一.shutil模塊 shutil模塊主要用於對文件或文件夾進行處理,包括:複製,移動,改名和刪除文件,在shutil模塊中主要以下這麼幾個函數: 1.複製文件和文件夾 shutil模塊提供了2個函數:shutil. ...
  • 1) { echo ""; return; } //HTTP頭部信息 header("Content-type: application/octet-stream"); header("Accept-Ranges: bytes"); he... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...