正則表達式---------匹配HTML標簽或標記

来源:http://www.cnblogs.com/liuhongfeng/archive/2016/03/11/5230905.html
-Advertisement-
Play Games

正則表達式匹配HTML標簽或標記 正則表達式 <(\S*?) [^>]*>.*?</\1>|<.*? /> 匹配 <html>hello</html>|<a>abcd</a> 不匹配 abc|123|<html>ddd 正則表達式 ^[^<>`~!/@\#}$%:;)(_^{&*=|'+]+$ 匹配


正則表達式匹配HTML標簽或標記

 

 

正則表達式    
<(\S*?) [^>]*>.*?</\1>|<.*? />
匹配    <html>hello</html>|<a>abcd</a>
不匹配    abc|123|<html>ddd
正則表達式    
^[^<>`~!/@\#}$%:;)(_^{&*=|'+]+$
匹配    This is a test
不匹配    <href = | <br> | That's it
正則表達式    
&lt;!--.*?--&gt;
匹配    &lt;!-- &lt;h1&gt;this text has been removed&lt;/h1&gt; --&gt; | &lt;!-- yada --&gt;
不匹配    &lt;h1&gt;this text has not been removed&lt;/h1&gt;
正則表達式    
(\[(\w+)\s*(([\w]*)=('|&quot;)?([a-zA-Z0-9|:|\/|=|-|.|\?|&amp;]*)(\5)?)*\])([a-zA-Z0-9|:|\/|=|-|.|\?|&amp;|\s]+)(\[\/\2\])
匹配    [link url=&quot;http://www.domain.com/file.extension?getvar=value&amp;secondvar=value&quot;]Link[/li
不匹配    [a]whatever[/b] | [a var1=something var2=somethingelse]whatever[/a] | [a]whatever[a]
正則表達式    
href=[\"\'](http:\/\/|\.\/|\/)?\w+(\.\w+)*(\/\w+(\.\w+)?)*(\/|\?\w*=\w*(&\w*=\w*)*)?[\"\']
匹配    href="www.yahoo.com" | href="http://localhost/blah/" | href="eek"
不匹配    href="" | href=eek | href="bad example"
正則表達式    
&quot;([^&quot;](?:\\.|[^\\&quot;]*)*)&quot;
匹配    &quot;This is a \&quot;string\&quot;.&quot;
不匹配    &quot;This is a \&quot;string\&quot;.
正則表達式    
(?i:on(blur|c(hange|lick)|dblclick|focus|keypress|(key|mouse)(down|up)|(un)?load|mouse(move|o(ut|ver))|reset|s(elect|ubmit)))
匹配    
     
onclick | onsubmit | onmouseover
不匹配    click | onandon | mickeymouse
正則表達式    
(?s)/\*.*\*/
匹配    /* .................... */ | /* imagine lots of lines here */
不匹配    */ malformed opening tag */ | /* malformed closing tag /*
正則表達式    
<(\S*?) [^>]*>.*?</\1>|<.*? />
匹配    <html>hello</html>|<a>abcd</a>
不匹配    abc|123|<html>ddd
正則表達式    
\xA9
匹配    ©
不匹配    anything
正則表達式    
src[^&gt;]*[^/].(?:jpg|bmp|gif)(?:\&quot;|\')
匹配    src=&quot;../images/image.jpg&quot; | src=&quot;http://domain.com/images/image.jpg&quot; | src='d:\w
不匹配    src=&quot;../images/image.tif&quot; | src=&quot;cid:value&quot;
正則表達式    
/\*[\d\D]*?\*/
匹配    /* my comment */ | /* my multiline comment */ | /* my nested comment */
不匹配    */ anything here /* | anything between 2 seperate comments | \* *\
正則表達式    
<[a-zA-Z]+(\s+[a-zA-Z]+\s*=\s*("([^"]*)"|'([^']*)'))*\s*/>
匹配    <img src="test.gif"/>
不匹配    <img src="test.gif"> | <img src="test.gif"a/>

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本文介紹在不使用PIL的情況下,使用Python保存截屏並保存屏幕截圖到.bmp文件。通過ctypes庫使用C指針來對記憶體進行操作。
  • Atitit.編程語言and 自然語言的比較and 編程語言未來的發展 1. 單詞的間隔靠空格,編程的單詞的間隔靠分界符..1 2. 語句分界符:自然語言使用逗號,編程語言使用分號1 3. 換行1 4. 段落and fun method2 5. 上下文相關2 6. 操作泛型化2 7. 動詞和名詞之間
  • 作者: "@gzdaijie" 本文為作者原創,轉載請註明出處:http://www.cnblogs.com/gzdaijie/p/5267166.html Java Web應用開發時常使用Gradle來進行項目管理,可以十分便利地解決包依賴等問題。war插件的出現,讓項目部署成為一個複製粘貼的過程
  • 建立映射關係 首先變數表應該採取一種將變數名對應到變數的方法,這種方法大致兩種,一種是將變數名parse時hash成數字,一種是直接建立string value的map。 + int |速度快|動態性弱,無法實現諸如getvar("abc")的功能 + string|速度慢|動態性強 其次選擇數據結
  • 剛剛看完了併發實踐這本書,算是理論具備了,看到了AQS的介紹,再看看源碼,發現要想把併發理解透還是很難得,花了幾個小時細分析了一下把可能出現的場景儘可能的往代碼中去套,還是有些收穫,但是真的很費腦,還是對多線程的理解太淺了,不多說了,直接上代碼吧。 這段代碼不是為跑通,只是把AQS,Reentran
  • 今天寫程式,遇到了一個要實現string.split()這個的一個函數。python裡面有,qt裡面有,c++裡面沒有。照著網上抄了一個,放在這裡。有需要的時候直接拽過去用,否則老是寫了小例子就扔,用的時候沒有,也是個麻煩事 例如 “aa*bb*cc” 會存儲成vector<string> "aa"
  • 今天工作中遇到一個要不一個double型的字元串轉換成一個純字數字元串和一個標誌這個數字字元串的小數點有幾位的int類型 例如:“23.123”---》“23123” + 3 比較簡單。就是把代碼貼這裡,以後用到了,可以直接拽來用 #include "stdafx.h" #include <stdl
  • [PHP] ; PHP還是一個不斷發展的工具,其功能還在不斷地刪減 ; 而php.ini的設置更改可以反映出相當的變化, ; 在使用新的PHP版本前,研究一下php.ini會有好處的 ;;;;;;;;;;;;;;;;;;; ; 關於這個文件 ; ;;;;;;;;;;;;;;;;;;; ; 這個文件控
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...