什麼是正則表達式: 1、正則表達式是由一個字元序列形成的搜索模式。 2、當你在文本中搜索數據時,你可以用搜索模式來描述你要查詢的內容。 3、正則表達式可以是一個簡單的字元,或一個更複雜的模式。 4、正則表達式可用於所有文本搜索和文本替換的操作。 5、JavaScript 中的正則表達式用 RegEx ...
什麼是正則表達式:
1、正則表達式是由一個字元序列形成的搜索模式。
2、當你在文本中搜索數據時,你可以用搜索模式來描述你要查詢的內容。
3、正則表達式可以是一個簡單的字元,或一個更複雜的模式。
4、正則表達式可用於所有文本搜索和文本替換的操作。
5、JavaScript 中的正則表達式用 RegExp 對象表示,可以使用 RegExp() 構造函數來創建 RegExp 對象,也可以通過直接量語法(包含在一對斜桿之間的字元)來創建
// 匹配所有以字元 's' 結尾的字元串,$ 表示匹配字元串的結尾 var pattern1 = new RegExp("s$"); var pattern2 = /s$/;
註:正則表達式里具有特殊含義的標點符號:^ $ . * + ? = ! : | \ / ( ) [ ] { },使用這些字元的直接量時必須加首碼 \
匹配分類:
1、字元類
let str = "hello words"; // [...] 匹配方框內任意字元,a-f 表示範圍 let pattern = /[a-f]/; console.log(str.match(pattern)); // [^...] 匹配不在方框內任意字元 pattern = /[^a-f]/; console.log(str.match(pattern)); // . 匹配除換行符和其他 Unicode 行終止符之外的任意字元 pattern = /./; console.log(str.match(pattern)); /* \w 匹配任意 ASCII 字元組成的單詞,等價於 [a-zA-Z0-9] \W 匹配任意不是 ASCII 字元組成的單詞,等價於 [^a-zA-Z0-9] \s 匹配任何 Unicode 空白符 \S 匹配任何不是 Unicode 空白符 \d 匹配數字,等價於[0-9] \D 匹配非數字,等價於[^0-9] [\b] 退格直接量 */ // 匹配任意不是 ASCII 字元組成的單詞或匹配數字 pattern = /[\W\d]/; console.log(str.match(pattern));
2、重覆
let str = "hello words"; // {n, m} 匹配前一項至少 n 次,最多 m 次;{n,} 匹配 n 次或更多次;{n} 匹配 n 次 let pattern = /\w{2,4}/; console.log(str.match(pattern)); // ? 匹配前一項 0 次或 1 次,等價於 {0, 1} // + 匹配前一項 1 次或多次,等價於 {1, } // * 匹配前一項 0 次或多次,等價於 {0, } pattern = /\w?/; console.log(str.match(pattern)); // 預設會儘可能多的匹配字元,如以下會匹配 hello pattern = /\w+/; console.log(str.match(pattern)); // 可在待匹配字元後面添加 ?,使它儘可能少的匹配 pattern = /\w+?/; // 匹配 h console.log(str.match(pattern)); // 註意 * 和 ? 可以匹配 0 個字元,下麵的 index 會返回 0 pattern = /\d*/; console.log(str.match(pattern));
3、選擇、分組和引用
let str = "abc123def"; // one|two[|...] 是匹配 one 或 two,從左往右匹配 let pattern = /ab|de/; console.log(str.match(pattern)); // (...) 將幾個項組合成一個單元,同時記住這個組合匹配的字元串以供此後的引用使用 pattern = /\d+(\w+)\1/; console.log(str.match(pattern)); // (?:...) 只組合,但不記憶該組合匹配字元串 pattern = /\w(?:\w+)\d+(\w+)/ console.log(str.match(pattern)); // \n 匹配第 n 個分組,從左往右,(?:...)不計入分組 str = "javaScript is fun"; // 本來應該匹配 (fun\w*),但返回了 null? pattern = /([Jj]ava(?:[Ss]cript)?)\sis\s(fun\w*)\2/; console.log(str.match(pattern));
4、指定位置匹配
let str = "javaScript is fun"; // ^ 匹配字元串開頭,註意和 [^...] 的區別 let pattern = /^\w+/; console.log(str.match(pattern)); // $ 匹配字元串的結尾 pattern = /\d+$/; console.log(str.match(pattern)); // \b 匹配單詞的邊界 pattern = /\b\w+\b/; console.log(str.match(pattern)); // \B 匹配非單詞邊界部分 pattern = /\B\w+\B/; console.log(str.match(pattern)); // (?=p) 零寬正向先行斷言,要求接下來的字元都於 p 匹配,但不包括 p pattern = /\s\w+(?=\s)/; console.log(str.match(pattern)); //匹配 ' is' // (?!p) 零寬負向先行斷言,要求接下來的字元都不與 p 匹配 pattern = /\s\w+(?!\w+)/; console.log(str.match(pattern)); //匹配 ' is'
5、修飾符
(1) i:不區分大小寫匹配
(2) g:全局匹配,找出所有匹配
(3) m:多行匹配模式, ^ 匹配一行的開頭和字元串的開頭,$ 匹配行的結尾和字元串的結尾
// 格式為 /pattern/modifiers let pattern = /[a-z]\d+/i
用於模式匹配的 String 方法:
search()、replace()、match()、split()
/* search() 的參數是一個正則表達式,返回第一個匹配子串的下標 search() 不支持全局檢索(g),若無匹配則返回 -1!! 若其參數不是正則表達式,則會調用 RegExp 構造函數將其轉換為正則表達式 */
let str = "javaScript is fun"; let pattern = /\s+\w+/; console.log("\"", str.match(pattern)[0], " \" its index is: ", str.search(pattern)); // replace() 第一個參數是正則表達式,第二個參數是供替換的字元串,也可以是個動態計算字元串的函數 pattern = /javascript/i; console.log("The original str: ", str, "\nAfter replace: ", str.replace(pattern, "JavaScript")); /* match(exp) 接受唯一一個參數就是正則表達式,它返回一個匹配結果組成的數組 該數組 arr[0] 存放完整匹配,arr[1] 存放第一個圓括弧括起來表達式相匹配的子串 以此類推 arr[n] 存放第 n 個圓括弧括起來表達式相匹配的子串 (?:...) 不計入在內!!! */ let text = "http://www.cnblogs.com/lemonyam"; // 需要用 '\' 轉義 '/' let url = /(\w+):\/\/([\w.]+)\/(\S*)/; let result = text.match(url); if (result != null) { console.log("fullUrl: ", result[0]); console.log("protocol: ", result[1]); console.log("host: ", result[2]); console.log("path: ", result[3]); } // split() 將按 split 的參數,把調用它的字元串拆成一個子串組成的數組,該參數可以是正則表達式! let temp = "1, 2, 3, 4".split(/\s*,\s*/); console.log(temp); //返回['1', '2', '3', '4']