筆記：正則表達式_ZenDei技術網路在線

筆記：正則表達式

-Advertisement-

正則表達式（regular expression）用於指定字元串的模式，可以在任何需要定位匹配某種特定模式的字元串的情況下使用正則表達式，正則表達式的語法如下：語法解釋字元c表示字元 c\unnnn,\xnn,\0n,\0nn,\0nnn具有給定十六進位或者十進位值的碼元\t,\n,\r,\f,\... ...

正則表達式（regular expression）用於指定字元串的模式，可以在任何需要定位匹配某種特定模式的字元串的情況下使用正則表達式，正則表達式的語法如下：

語法	解釋
字元
c	表示字元 c
\unnnn,\xnn,\0n,\0nn,\0nnn	具有給定十六進位或者十進位值的碼元
\t,\n,\r,\f,\a	控制符：製表符、換行符、回車符、換頁符、警告符
字元類
[C₁,C₂,…]	任何由C₁、C₂，…表示的字元，其中C₁可以表示多個字元，字元範圍C₁-C₂或者字元類
[^…]	排除匹配，^之後的字元不能匹配
[… && …]	二個字元集的交集
預定義字元類
.	除了行終止符之外的所有字元（在 DOTALL 標誌被設置時，則表示所有字元）
\d	一個數字，等價 [0-9]
\D	一個非數字，等價[^0-9]
\s	一個空白字元[\t\n\r\f\x0B]
\S	一個非空白字元
\w	一個詞語字元[a-zA-Z0-9_]
\W	一個非詞語字元
\p{name}	一個命名字元類，命名字元參考命名字元表
\P{name}	一個命名字元類的補集
邊界匹配符
^ $	表示輸入的開頭和結尾（或者在多行模式下行的開頭和結尾）
\b	一個詞語邊界
\B	一個非詞語邊界
\A	輸入的開頭
\z	輸入的結尾
\Z	除了行終止符之外的輸入結尾
\G	前一個匹配的結尾
量詞
X?	可選的X
X*	X重覆0次或多次
X+	X重覆1次或多次
X{n} X{n,} X{n,m}	X重覆n次，至少n次，在n到m次之間
量詞尾碼
？	在預設（貪婪）匹配轉變為勉強匹配
+	在預設（貪婪）匹配轉變為占用匹配
集合操作
XY	在任何X中的字元串，後面跟隨任何Y中的字元串
X\|Y	任何X或Y中的字元串
群組
（X）	將X做為群組
\n	第 n 個群組的匹配

匹配標誌：

CASE_INSENSITIVE：匹配字元時不區分字母的大小寫，預設情況下，這個標誌只考慮US ASCII 字元
UNICODE_CASE：當與CASE_INSENSITIVE組合時，用Unicode字母的大小寫來匹配
MULTILINE：^ 和 $ 匹配行的開頭和結尾，而不是整個輸入的開頭和結尾
UNIX_LINUX：在多行模式中匹配 ^ 和 $ 時，只有 '\n' 被識別成行終止符
DOTALL：當使用整個標誌時，. 符號匹配所有字元，包含行終止符

示例代碼：

字元串匹配：
        Pattern pattern = Pattern.compile("^[a-zA-Z0-9]+$");
        String testString = "sdlfkjsdkfj342349898LKJKJ";
        Matcher matcher = pattern.matcher(testString);
        System.out.println("testString=" + testString + " pattern=" + pattern.pattern() + " matcher " + matcher.matches());
        System.out.println("-----------------------------------------------------------");
排除匹配：
        pattern = Pattern.compile("[^89]+");
        testString = "1234567890";
        matcher = pattern.matcher(testString);
        System.out.println("testString=" + testString + " pattern=" + pattern.pattern() + " matcher " + matcher.matches());
        testString = "1234567";
        matcher = pattern.matcher(testString);
        System.out.println("testString=" + testString + " pattern=" + pattern.pattern() + " matcher " + matcher.matches()
+" string "+ matcher.group());
        System.out.println("-----------------------------------------------------------");
群組匹配：
        pattern = Pattern.compile("([a-zA-Z0-9]+):([0-9]+)");
        testString = "a000001:330,a0000002:440,a0000004:445";
        matcher = pattern.matcher(testString);
        while (matcher.find()) {
                System.out.println("group 0 value " + matcher.group(0) + " start " + matcher.start(0) + " end " + matcher.end(0));
                System.out.println("group 1 value " + matcher.group(1) + " start " + matcher.start(1) + " end " + matcher.end(1));
                System.out.println("group 2 value " + matcher.group(2) + " start " + matcher.start(2) + " end " + matcher.end(2));
                System.out.println("-----------------------------------------------------------");
        }
匹配替換字元串：
        pattern = Pattern.compile("[ab]+");
        testString = "abcdefghijkmul";
        matcher = pattern.matcher(testString);
        String output = matcher.replaceAll("8");
        System.out.println("pattern " + pattern.pattern() + " input string " + testString + " replace " + output);
        output = matcher.replaceAll(Matcher.quoteReplacement("$"));
        System.out.println("pattern " + pattern.pattern() + " input string " + testString + " replace " + output);
        output = matcher.replaceAll("\\$");
        System.out.println("pattern " + pattern.pattern() + " input string " + testString + " replace " + output);
        System.out.println("-----------------------------------------------------------");
匹配分隔字元串：
        pattern = Pattern.compile(",");
        testString = "a000001:330,a0000002:440,a0000004:445";
        String[] tokens = pattern.split(testString);
        for (int i = 0; i < tokens.length; i++) {
                System.out.println("pattern " + pattern.pattern() + " testString " + testString + " split " + tokens[i]);
        }
        System.out.println("-----------------------------------------------------------");

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

純Python給ulaw wav文件加頭

最近在處理wav相關文件，碰見一工具產生的ualw文件不帶header，順手用python給wav格式文件加頭處理，讓普通播放器也能播放。（原文：http://www.cnblogs.com/ryhan/p/6854348.html）相關代碼文件下載：files.cnblogs.com/file ...
python第十二天

第二模塊學習: 生成器，迭代器，內置函數生成器特點：只有在調用時才會生成相應的數據，運行的速度快！示例： yield 生成器斷點緩存可賦於變數 .send()可以為yield 傳值、數據示例：迭代器：Iterator 可以返回下一個值的迭代對象，就可以稱為迭代器迭代對象：Iterable ...
python (001)----列表

Python 的列表數據類型包含更多的方法。這裡是所有的列表對象方法：把一個元素添加到列表的結尾，相當於 a[len(a):] = [x]。將一個給定列表中的所有元素都添加到另一個列表中，相當於 a[len(a):] = L。在指定位置插入一個元素。第一個參數是準備插入到其前面的那個元素的索引 ...
P1012 拼數

題目描述設有n個正整數（n≤20），將它們聯接成一排，組成一個最大的多位整數。例如：n=3時，3個整數13，312，343聯接成的最大整數為：34331213 又如：n=4時，4個整數7，13，4，246聯接成的最大整數為：7424613 輸入輸出格式輸入格式：第一行，一個正整數n。第二行 ...
第六講圖（上）

06 圖1：列出連通集. Description: 給定一個有N個頂點和E條邊的無向圖，請用DFS和BFS分別列出其所有的連通集。假設頂點從0到N 1編號。進行搜索時，假設我們總是從編號最小的頂點出發，按編號遞增的順序訪問鄰接點。 Input: 輸入第1行給出2個整數N(0, 10)和E，分別是圖的 ...
P1093 獎學金

題目描述某小學最近得到了一筆贊助，打算拿出其中一部分為學習成績優秀的前5名學生髮獎學金。期末，每個學生都有3門課的成績:語文、數學、英語。先按總分從高到低排序，如果兩個同學總分相同，再按語文成績從高到低排序，如果兩個同學總分和語文成績都相同，那麼規定學號小的同學排在前面，這樣，每個學生的排序是唯 ...
反轉一個英文句子中的單詞，並且對應位置大小寫不改變

輸入一句英文句子，只有英文字(a-z, A-Z)、每個字之間僅以一個空格分格，前後沒有空格。返回的是把每一個字的字母順序倒轉寫，但字的順序和字母的大小寫位置則保持不変 ...
P1583 魔法照片

題目描述一共有n（n≤20000）個人（以1--n編號）向佳佳要照片，而佳佳只能把照片給其中的k個人。佳佳按照與他們的關係好壞的程度給每個人賦予了一個初始權值W[i]。然後將初始權值從大到小進行排序，每人就有了一個序號D[i]（取值同樣是1--n）。按照這個序號對10取模的值將這些人分為10類。也 ...