電腦程式的思維邏輯 (88) - 正則表達式 (上)

来源:http://www.cnblogs.com/swiftma/archive/2017/06/06/6947316.html
-Advertisement-
Play Games

​上節我們提到了正則表達式,它提升了文本處理的表達能力,本節就來討論正則表達式,它是什麼?有什麼用?各種特殊字元都是什麼含義?如何用Java藉助正則表達式處理文本?都有哪些常用正則表達式?由於內容較多,我們分為三節進行探討,本節先簡要探討正則表達式的語法。 正則表達式是一串字元,它描述了一個文本模式 ...


​上節我們提到了正則表達式,它提升了文本處理的表達能力,本節就來討論正則表達式,它是什麼?有什麼用?各種特殊字元都是什麼含義?如何用Java藉助正則表達式處理文本?都有哪些常用正則表達式?由於內容較多,我們分為三節進行探討,本節先簡要探討正則表達式的語法。

正則表達式是一串字元,它描述了一個文本模式,利用它可以方便的處理文本,包括文本的查找、替換、驗證、切分等。

正則表達式中的字元有兩類,一類是普通字元,就是匹配字元本身,另一類是元字元,這些字元有特殊含義,這些元字元及其特殊含義就構成了正則表達式的語法。

正則表達式有一個比較長的歷史,各種與文本處理有關的工具、編輯器和系統都支持正則表達式,大部分編程語言也都支持正則表達式。雖然都叫正則表達式,但由於歷史原因,不同語言、系統和工具的語法不太一樣,本文主要針對Java語言,其他語言可能有所差別。

下麵,我們就來簡要介紹正則表達式的語法,我們先分為以下部分分別介紹:

  • 單個字元
  • 字元組
  • 量詞
  • 分組
  • 特殊邊界匹配
  • 環視邊界匹配

最後針對轉義、匹配模式和各種語法進行總結。

單個字元

大部分的單個字元就是用字元本身表示的,比如字元'0','3','a','馬'等,但有一些單個字元使用多個字元表示,這些字元都以斜杠'\'開頭,比如:

  • 特殊字元,比如tab字元'\t',換行符'\n',回車符'\r'等;
  • 八進位表示的字元,以\0開頭,後跟1到3位數字,比如\0141,對應的是ASCII編碼為97的字元,即字元'a';
  • 十六進位表示的字元,以\x開頭,後跟兩位字元,比如\x6A,對應的是ASCII編碼為106的字元,即字元'j';
  • Unicode編號表示的字元,以\u開頭,後跟四位字元,比如\u9A6C,表示的是中文字元'馬',這隻能表示編號在0xFFFF以下的字元,如果超出0XFFFF,使用\x{...}形式,比如對於字元'
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • linux下部署php項目環境可以分為兩種,一種使用Apache,php,mysql的壓縮包安裝,一種用yum命令進行安裝。 使用三種軟體的壓縮包進行安裝,需要手動配置三者之間的關係。apache和php之間的配置沒有什麼難度,但是和mysql進行配置的時候就需要對php的瞭解了。 以下是用yum在 ...
  • 聲明:本文為轉載內容,感謝原作者辛勤勞動。原鏈接為:http://www.cnblogs.com/chinahbzm/articles/1423875.html 1)建立空連接: net use \\IP\ipc$ "" /user:"" (一定要註意:這一行命令中包含了3個空格) 2)建立非空連接 ...
  • 引言 最新有一個winform項目使用的是DevExpress的控制項,所以最近都在摸索使用這套控制項,實在是佩服整套控制項的強大,同時代碼寫起來也簡潔。客戶有一個需求,希望報表結果能在外接的大屏幕上定時滾動。這個報表我們使用的控制項就是GridControl,查詢結果一屏不能顯示完全,增加一個定時器,指定 ...
  • 什麼是AspectCore Project ? "AspectCore Project" 是適用於Asp.Net Core 平臺的輕量級 Aop(Aspect oriented programming) 解決方案,它更好的遵循Asp.Net Core的模塊化開發理念,使用AspectCore可以更容 ...
  • 一:安裝 運行項目後,進去安裝頁面,按照提示輸入,填寫的管理員郵箱和密碼,即超管的賬號,登陸後,頂部會有後臺鏈接。 二:無法進入後臺 解決辦法:生成下解決方案就好了。 三:首頁Banner在哪改? 進入後臺,Configuration -> Widgets -> Widgets.NivoSlider ...
  • IdentityServer4 預設提供了兩種證書加密配置: 這兩種證書加密方式,都是臨時使用,每次重啟項目的時候,都會重新生成一個新的證書,這時候就會導致一個問題,重啟之前生成的 ,在重啟之後,就不適用了,因為證書改變了,對應的加密方式也改變了,所以,就會出現下麵這個問題: 錯誤信息: Www A ...
  • 前言 樹莓派(Raspberry Pi,RPi)是專門為學生電腦編程教育而設計,只有信用卡大小的卡片式電腦,可以運行Linux或者Windows 10 IoT Core操作系統。本文將利用樹莓派和UWP(Universal Windows Platform)開發技術搭建一個可以實時監控的氣象站系統 ...
  • foreach可以遍歷一些數據類型。由圖可知,被遍歷的數據類型必須擁有GetEnumerator的公共方法。 在使用foreach遍歷時涉及到var推斷類型,這時如何不是實現泛型版本,則一律是object類型。 foreach遍歷只能讀取數據,不能修改數據,可以通過string檢測,string是可 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...