.NET開發正則表達式中的 Bug_ZenDei技術網路在線

.NET開發正則表達式中的 Bug

-Advertisement-

又發現了一個 .net 的 bug!最近在使用正則表達式的時候發現：在忽略大小寫的時候，匹配值從 0xff 到 0xffff 之間的所有字元，正則表達式竟然也能匹配兩個 ASCII 字元：i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和數字。 ....

又發現了一個 .net 的 bug!最近在使用正則表達式的時候發現：在忽略大小寫的時候，匹配值從 0xff 到 0xffff 之間的所有字元，正則表達式竟然也能匹配兩個 ASCII 字元：i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和數字。

　　比如以下的代碼就是用來測試用正則表達式匹配從 0xff 到 0xffff 的字元。而值範圍在 0 到 0xfe 的所有字元是不能被匹配的。

　　1234567891011121314151617Regex regex = new Regex(@"[\u00FF-\uFFFF]+");
　　// The characters, whoes value are smaller than 0xff, are not expected to be matched.
　　for (int i = 0; i < 0xff; i++) {
　　string s = new string(new char[] { (char)i });
　　Debug.Assert(
　　!regex.IsMatch(s),
　　string.Format("The character was not expected to be matched: 0x{0:X}!", i));
　　}
　　// However, the characters whoes value are greater than 0xfe are expected to be matched.
　　for (int i = 0xff; i <= 0xffff; i++) {
　　string s = new string(new char[] { (char)i });
　　Debug.Assert(
　　regex.IsMatch(s),
　　string.Format("The character was expected to be matched: 0x{0:X}!", i));
　　}

　　這時的運行結果是正常的，沒有任何的斷言錯誤出現。

　　然而當使用忽略大小寫的匹配模式時，結果就不一樣了。將上面代碼中的第一行改成：

　　1Regex regex = new Regex(@"[\u00FF-\uFFFF]+", RegexOptions.IgnoreCase);

　　程式運行的時候就會有兩處斷言錯誤。它們分別是字元值為 73 和 105，也就是小寫字母 i 和大寫字母 I。這個 bug 非常奇怪，別的字元都很正常!而且用 javascript 腳本在 IE (版本是6.0)裡面運行也同樣有這麼 bug 存在(比如下麵這段代碼)。然而在 Firefox 中運行就是沒有問題的。還是 Firefox 好啊，呵呵!

　　1234567891011121314151617var re = /[\u00FF-\uFFFF]+/;
　　// var re = /[\u00FF-\uFFFF]+/i;
　　for(var i=0; i<0xff; i++) {
　　var s = String.fromCharCode( i );
　　if ( re.test(s) ){
　　alert( ''Should not be matched: '' + i + ''!'' );
　　}
　　}
　　for(var i=0xff; i<=0xffff; i++) {
　　var s = String.fromCharCode( i );
　　if ( !re.test(s) ){
　　alert( ''Should be matched: '' + i + ''!'' );
　　}
　　}

轉載自:http://www.aspnetjia.com/Cont-171.html

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

linux線程同步(3)-讀寫鎖

一.概述讀寫鎖與互斥量的功能類似，對臨界區的共用資源進行保護！互斥量一次只讓一個線程進入臨界區，讀寫鎖比它有更高的並行性。讀寫鎖有以下特點：1.如果一個線程用讀鎖鎖定了臨界區，那麼其他線程也可以用讀鎖來進入臨界區，這樣就可以多個線程並行操作。但這個時...
使用parted給大於2T的磁碟分區

1.使用命令parted /dev/sdb 1 [root@server ~]# parted /dev/sdb 2 GNU Parted 2.1 3 使用 /dev/sdb 4 Welcome to GNU Parted! Type 'help' to view a list of command...
Linux賬號密碼過期會導致crontab作業不能執行

今天一同事報告Linux伺服器上的crontab作業沒有運行，檢查/var/log/cron日誌後發現下麵錯誤信息 Jan 19 16:30:01 xxxx crond[31399]: Authentication token is no longer valid; new one required...
使用fdisk給新增加硬碟分區

1.使用fdisk創建6個分區[1P+1E(5L)] //dev/sdb1 /dev/sdb5 /dev/sdb6 /dev/sdb7 /dev/sdb8 /deb/sdb9 1 [root@server ~]# fdisk -l 2 3 Disk /dev/sda: 8589 MB, 8589.....
ubuntu下安裝git，sublime，nodejs

用的是VMware10.0版本的虛擬機，很早之前下載的今天就直接用了，安裝挺簡單記得需要一個序列號。在這裡：http://mirrors.163.com/ubuntu-releases/15.04/ubuntu-15.04-desktop-i386.iso 下載的ubuntu15.04ISO鏡像(....
linux的at命令

at命令用於在指定時間執行命令。at允許使用一套相當複雜的指定時間的方法。它能夠接受在當天的hh:mm（小時:分鐘）式的時間指定。假如該時間已過去，那麼就放在第二天執行。當然也能夠使用midnight（深夜），noon（中午），teatime（飲茶時間，一般是下午4點）等比較模糊的詞語來指定時間。...
access應用分享

我最近開發了一個winform項目，用的是access資料庫，當開發成功以後，有些電腦上就能正常運行，有些電腦就無法讀取資料庫文件，剛開始我以為是許可權問題，後來我把安裝程式卸載了，裝在其它盤中（非C盤），奇跡發生了，正常運行，但是我又在其它電腦上安裝不管是C盤還是其它盤都不行，後來我以為是電...
基於Metronic的Bootstrap開發框架經驗總結（9）--實現Web頁面內容的列印預覽和保存操作

在前面介紹了很多篇相關的《Bootstrap開發框架》的系列文章，這些內容基本上覆蓋到了我這個Bootstrap框架的各個主要方面的內容，總體來說基本達到了一個穩定的狀態，隨著時間的推移可以會引入一些更好更新的內容進行完善，本篇繼續這個系列，主要介紹如何實現Web頁面內容的列印預覽和保存操作。

.NET開發 正則表達式中的 Bug

.NET開發正則表達式中的 Bug