PHP正則表達式入門教程[轉]

来源:http://www.cnblogs.com/shouce/archive/2016/05/17/5503045.html
-Advertisement-
Play Games

思維導圖 點擊下圖,可以看具體內容! 介紹 正則表達式,大家在開發中應該是經常用到,現在很多開發語言都有正則表達式的應用,比如javascript,java,.net,php等等,我今天就把我對正則表達式的理解跟大家嘮嘮,不當之處,請多多指教! 需要知道的術語——下麵的術語你知道多少? 需要知道的術 ...


思維導圖 點擊下圖,可以看具體內容!

    介紹          正則表達式,大家在開發中應該是經常用到,現在很多開發語言都有正則表達式的應用,比如javascript,java,.net,php等等,我今天就把我對正則表達式的理解跟大家嘮嘮,不當之處,請多多指教!   需要知道的術語——下麵的術語你知道多少?   Δ  定界符 Δ  字元域 Δ  修飾符 Δ  限定符 Δ  脫字元 Δ  通配符(正向預查,反向預查) Δ  反向引用 Δ  惰性匹配 Δ  註釋 Δ  零字元寬   定位          我們什麼時候使用正則表達式呢?不是所有的字元操作都用正則就好了,php在某些方面用正則反而影響效率。當我們遇到複雜文本數據的解析時候,用正則是比較好的選擇。   優點         正則表達式在處理複雜字元操作的時候,可以提高工作效率,也在一定程度節省你的代碼量。   缺點          我們在使用正則表達式的時候,複雜的正則表達式會加大代碼的複雜度,讓人很難理解。所以我們有的時候需要在正則表達式內部添加註釋。   通用模式

   ¤ 定界符,通常使用 "/"做為定界符開始和結束,也可以使用"#"。   什麼時候使用"#"呢?一般是在你的字元串中有很多"/"字元的時候,因為正則的時候這種字元需要轉義,比如uri。      使用"/"定界符的代碼如下.
$regex = '/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i'; $str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

    preg_match中的$matches[0]將包含與整個模式匹配的字元串。 

    使用"#"定界符的代碼如下.這個時候對"/"就不轉義!

$regex = '#^http://([\w.]+)/([\w]+)/([\w]+)\.html$#i'; $str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

  ¤ 修飾符:用於改變正則表達式的行為。

     我們看到的('/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html/i')中的最後一個"i"就是修飾符,表示忽略大小寫,還有一個我們經常用到的是"x"表示忽略空格。

貢獻代碼:

  

$regex = '/HELLO/'; $str = 'hello word'; $matches = array();   if(preg_match($regex, $str, $matches)){     echo 'No i:Valid Successful!',"\n"; }   if(preg_match($regex.'i', $str, $matches)){     echo 'YES i:Valid Successful!',"\n"; }

 

  ¤ 字元域:[\w]用方括弧擴起來的部分就是字元域。

  ¤ 限定符:如[\w]{3,5}或者[\w]*或者[\w]+這些[\w]後面的符號都表示限定符。現介紹具體意義。

     {3,5}表示3到5個字元。{3,}超過3個字元,{,5}最多5個,{3}三個字元。

     * 表示0到多個

     + 表示1到多個。

  ¤ 脫字元號

      ^:

          > 放在字元域(如:[^\w])中表示否定(不包括的意思)——“反向選擇”

          >  放在表達式之前,表示以當前這個字元開始。(/^n/i,表示以n開頭)。

      註意,我們經常管"\"叫"跳脫字元"。用於轉義一些特殊符號,如".","/"

 

通配符(lookarounds):斷言某些字元串中某些字元的存在與否!   lookarounds分兩種:lookaheads(正向預查 ?=)和lookbehinds(反向預查?<=)。 > 格式: 正向預查:(?=) 相對應的 (?!)表示否定意思 反向預查:(?<=) 相對應的 (?<!)表示否定意思 前後緊跟字元
$regex = '/(?<=c)d(?=e)/'/* d 前面緊跟c, d 後面緊跟e*/ $str = 'abcdefgk'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

否定意義:

$regex = '/(?<!c)d(?!e)/'/* d 前面不緊跟c, d 後面不緊跟e*/ $str = 'abcdefgk'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

 

>字元寬度:零 驗證零字元代碼
$regex = '/HE(?=L)LO/i'; $str = 'HELLO'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

列印不出結果!

$regex = '/HE(?=L)LLO/i'; $str = 'HELLO'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

 能列印出結果!

說明:(?=L)意思是HE後面緊跟一個L字元。但是(?=L)本身不占字元,要與(L)區分,(L)本身占一個字元。

  捕獲數據   沒有指明類型而進行的分組,將會被獲取,供以後使用。 > 指明類型指的是通配符。所以只有圓括弧起始位置沒有問號的才能被捕捉。

> 在同一個表達式內的引用叫做反向引用。 > 調用格式: \編號(如\1)。
$regex = '/^(Chuanshanjia)[\w\s!]+\1$/';    $str = 'Chuanshanjia thank Chuanshanjia'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

 

> 避免捕獲數據    格式:(?:pattern)    優點:將使有效反向引用數量保持在最小,代碼更加、清楚。   >命名捕獲組    格式:(?P<組名>) 調用方式 (?P=組名)
$regex = '/(?P<author>chuanshanjia)[\s]Is[\s](?P=author)/i'; $str = 'author:chuanshanjia Is chuanshanjia'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

運行結果

  

惰性匹配(記住:會進行兩部操作,請看下麵的原理部分)

  格式:限定符?

     原理:"?":如果前面有限定符,會使用最小的數據。如“*”會取0個,而“+”會取1個,如過是{3,5}會取3個。

先看下麵的兩個代碼:

代碼1.

<?php $regex = '/heL*/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

  結果1.

 

代碼2

<?php $regex = '/heL*?/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

  結果2

 

代碼3,使用“+”

<?php $regex = '/heL+?/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

 結果3

代碼4,使用{3,5}

<?php $regex = '/heL{3,10}?/i'; $str = 'heLLLLLLLLLLLLLLLL'; if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

 結果4

   

正則表達式的註釋   格式:(?# 註釋內容) 用途:主要用於複雜的註釋    貢獻代碼:是一個用於連接MYSQL資料庫的正則表達式
$regex = '/     ^host=(?<!\.)([\d.]+)(?!\.)                 (?#主機地址) \|     ([\w!@#$%^&*()_+\-]+)                       (?#用戶名) \|     ([\w!@#$%^&*()_+\-]+)                       (?#密碼) (?!\|)$/ix';   $str = 'host=192.168.10.221|root|123456'; $matches = array();   if(preg_match($regex, $str, $matches)){     var_dump($matches); }   echo "\n";

 

  特殊字元    
特殊字元 解釋
* 0到多次
+ 1到多次還可以寫成{1,}
? 0或1次
. 匹配除換行符外的所有單個的字元
\w [a-zA-Z0-9_]
\s 空白字元(空格,換行符,回車符)[\t\n\r]
\d [0-9]

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 下麵是Java中10個最常見的關於字元串的問題。 怎樣比較字元串?使用==還是equals() 簡單的說,“==”用於判斷引用是否相等,equals()用於判斷值是否相等。除非你要比較兩個字元串是否是同一個對象,否則你應該使用equals()方法。如果你知道字元串駐留的概念會更好。 對於敏感信息優先 ...
  • 模塊文件: 首先,你需要一個目錄來放你的模塊,最好不要放在nginx的代碼目錄裡面。你的目錄裡面至少需要兩個文件: "config" "ngx_http__module.c" config文件會在./configure配置時被包含,它需要一些配置 過濾模塊的 "config"文件: 其他模塊的 "c ...
  • Given a list, rotate the list to the right by k places, where k is non-negative. For example:Given 1->2->3->4->5->NULL and k = 2,return 4->5->1->2->3- ...
  • 通用類型的SWAP函數的實現 通用數組類型的線性搜索函數的實現 c void lSerch(void key,void base,int n,int elemSize){ void elemAddr; for(int i;i ...
  • Scrapy是一個為了爬取網站數據,提取結構性數據而編寫的應用框架。 其可以應用在數據挖掘,信息處理或存儲歷史數據等一系列的程式中。其最初是為了頁面抓取 (更確切來說, 網路抓取 )所設計的, 也可以應用在獲取API所返回的數據(例如 Amazon Associates Web Services ) ...
  • 代碼結構: 1、ThymeleafController 1 package com.xxx.firstboot.web; 2 3 import org.springframework.stereotype.Controller; 4 import org.springframework.ui.Mod ...
  • Implement strStr(). Returns the index of the first occurrence of needle in haystack, or -1 if needle is not part of haystack. 暴力 KMP 以後寫。。 ...
  • 對於三目運算符(ternary operator),python可以用conditional expressions來替代 如對於x<5?1:0可以用下麵的方式來實現 1if x<5else 0 註: conditional expressions是在python 2.5之前引入的,所以以上代碼僅適 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...