R語言學習筆記（二十一）：字元串處理中的元字元

-Advertisement-

元字元有自己的特殊含義內的任意字元將被匹配對元字元進行轉義匹配字元串的開頭，將^置於character class 的首位表達的意思是取反義。如[ˆ5] 表示匹配除了“5” 以外的所有字元。 test_vector ...

元字元有自己的特殊含義

[ ]內的任意字元將被匹配

grep(pattern = "[wW]", x = states, value = T)
grep(pattern = "w", ignore.case = T, x = states, value = T)

\對元字元進行轉義

strsplit("strsplit.also.uses", split = ".")
strsplit("strsplit.also.uses", split = "\\.")
str_extract_all("me credit card: 334", pattern = "\\d")

^匹配字元串的開頭，將^置於character class 的首位表達的意思是取反義。如[ˆ5] 表示匹配除了“5” 以外的所有字元。

test_vector <- c("123","456","321")
str_extract_all(test_vector, "3")
str_extract_all(test_vector, "^3")
str_extract_all(test_vector, "[^3]")

$匹配字元串的結尾。但將它置於character class 內則消除了它的特殊含義。如 [akm$]將匹配 a , k , m 或者 $ 。

str_extract_all(test_vector, "3$")
str_extract_all(test_vector, "[3$]")

.匹配除換行符以外的任意字元。

str_extract_all(string = c("regular.exp\n","\n"), pattern =".")

| 或者

str_extract_all(string = "we23", pattern ="b|w|3")

?此符號前的字元(組) 是可有可無的，並且最多被匹配一次

str_extract_all(string = c("abc","bc","ac"),pattern = "ab?c")

( )表示一個字元組，括弧內的字元串將作為一個整體被匹配

str_extract_all(string = c("abc","ac","cde"),pattern = "(ab)c")

*此符號前的字元(組) 將被匹配零次或多次

str_extract_all(string = c("abab","abc","ac"),pattern = "(ab)*")

+前面的字元(組) 將被匹配一次或多次

str_extract_all(string = c("abbab","abc","ac"),pattern = "ab+")

{n,m} 重覆n次到m次

str_extract_all(string = c("abababab","ababc","abc"),pattern = "(ab){2}")
str_extract_all(string = c("abababab","ababc","abc"),pattern = "(ab){2,}")
str_extract_all(string = c("abababab","ababc","abc"),pattern = "(ab){2,3}")

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

最笨的方法解賊簡單的題

題目：輸入一個5x5矩陣，將其中最大的元素移到中心，4個角分別放4個最小的元素（順序從左到右，從上到下以此從小到大存放）思路：最大值是最好找的，迴圈遍歷一次，找出最大值和其地址。然後就是找最小的那4個數字，我的思路是首先用一數組來存放二維數組的第一行，然後從第二行開始遍歷，從該數組b中最大的元素開 ...
python網路編程（進程與多線程）

multiprocessing模塊由於GIL的存在，python中的多線程其實並不是真正的多線程，如果想要充分地使用多核CPU的資源，在python中大部分情況需要使用多進程。 multiprocessing包是Python中的多進程管理包。與threading.Thread類似，它可以利用mul ...
K：平衡二叉樹(AVL)

相關介紹：二叉查找樹的查找效率與二叉樹的形狀有關，對於按給定序列建立的二叉排序樹，若其左、右子樹均勻分佈，則查找過程類似於有序表的二分查找，時間複雜度變為O(log2n)。當若給定序列原來有序，則建立的二叉查找樹就蛻化為單鏈表，其查找效率同順序查找一樣，時間複雜度為O（n）。因此，在構 ...
Java學習筆記43（列印流、IO流工具類簡單介紹）

列印流：有兩個類：PrintStream，PrintWriter類，兩個類的方法一致，區別在於構造器 PrintStream：構造方法：接收File類型，接收字元串文件名，接收位元組輸出流（OutputStream） PringWriter：構造方法：接收File類型，接收字元串文件名，接收位元組輸出 ...
java web response提供文件下載功能

webapp項目的結構如下圖： download.html文件的內容如下：負責處理下載的Servlet——download.java文件的內容如下：在瀏覽器地址欄中輸入http://localhost:8080/DownloadServlet/download.html。註：若您覺得這篇文章還 ...
[linux] C語言Linux系統編程-TCP通信的11種狀態

三次握手由client主動發出SYN請求, 此時client處於SYN_SENT狀態(第一次握手)當server收到之後會由LISTEN轉變為SYN_REVD狀態, 並回覆client, client收到應答後處於ESTABLISHED狀態, 這個狀態就表示client已經準備好通信了(第二次握手) ...
IEEE754標準的浮點數存儲格式

基本存儲格式（從高到低）： Sign + Exponent + Fraction Sign ：符號位 Exponent ：階碼 Fraction ：有效數字 32位浮點數存儲格式解析 Sign ： 1 bit（第31個bit） Exponent ：8 bits （第 30 至 23 共 8 ...
Java學習筆記42（序列化流）

對象中的數據，以流的形式，寫入到文件中保存過程稱為寫出對象，對象的序列化 ObjectOutputStream將對象寫到文件中，實現序列化在文件中，以流的形式，將對象讀取出來，讀取對象，對象的反序列化 ObjectInputStream將文件對象讀取出來，實現反序列化示例：簡單寫一個類： ...