【提取內容圖片地址】 【去掉字元串中的數字】 ...
【提取內容圖片地址】
1 /// <summary> 2 /// 取得HTML中所有圖片的 URL。 3 /// </summary> 4 /// <param name="sHtmlText">HTML代碼</param> 5 /// <returns>圖片的URL列表</returns> 6 public static string[] GetHtmlImageUrlList(string sHtmlText) 7 { 8 // 定義正則表達式用來匹配 img 標簽 9 Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase); 10 11 // 搜索匹配的字元串 12 MatchCollection matches = regImg.Matches(sHtmlText); 13 int i = 0; 14 string[] sUrlList = new string[matches.Count]; 15 // 取得匹配項列表 16 foreach (Match match in matches) 17 sUrlList[i++] = match.Groups["imgUrl"].Value; 18 return sUrlList; 19 }
【去掉字元串中的數字】
1 /// <summary> 2 /// 去掉字元串中的數字 3 /// </summary> 4 /// <param name="key"></param> 5 /// <returns></returns> 6 public string GetNumber(string key) 7 { 8 return Regex.Replace(key, @"([1-9]+[0-9]*|0)(\\.[\\d]+)?", ""); 9 10 }