`
xllily
  • 浏览: 117550 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

怎么用正则表达式获取文章内容中的<img标签和 src的路径

阅读更多

正则:

查找Img标签开头的图片路径
[iI][mM][gG][\s]*[sS][rR][cC][\s]*=[\s'"]*(?<ref_value>.*?(\.gif|\.jpg|\.png))

查找Function中的图片路径
[a-zA-Z_][a-zA-Z0-9_]+[\s]*\([^)]+?('|")(?<ref_value>[a-zA-Z0-9/\\-_\.]+?(\.gif|\.jpg|\.png))('|")[^)]*\)

查找background标签的图片路径
background="(?<ref_value>[^"]+)

查找URL的图片路径
:[\s]*url[\s]*\([\s"']*(?<ref_value>["']*[^)]+)

通用的:
("|')(?<ref_value>[^"']+?(\.gif|\.png|\.jpg))("|')


url\(['\"]?\s*(?<ref_value>[^>]+?)['\"]?\s*\)
Cimg[\d+]*[\s]*\([\s"']*(?<ref_value>[^"')]+)

 

 

private IList<string> MatchImgPath(string content, string regexPattern)
  {
  IList<string> _ret = new List<string>();
  Regex reg = new Regex(regexPattern);
  string _imgPath = "";
  MatchCollection mc = reg.Matches(content);
  if (mc != null && mc.Count > 0)
  {
  foreach (Match match in mc)
  {
  if (match.Success == false || match.Value == null || match.Value == "")
  continue;

  foreach (string name in reg.GetGroupNames())
  {
  if (name == null || name == "" || name == "0")
  continue;

  if (name == "ref_value"
  && match.Groups[name].Value != null
  && match.Groups[name].Value != "")
  {
  _imgPath = match.Groups[name].Value;
  if(!_ret.Contains(_imgPath.ToLower()))
  _ret.Add(_imgPath.ToLower());
  }
  }
  }
  }
  return _ret;
  }

0
0
分享到:
评论

相关推荐

    正则获取html中的 <img src = 图片地址

    通过正则表达式,解析html中的&lt;img 标签,获取图片地址。还有部分正则没处理显示

    Java正则表达式去除img标签的src内容

    java代码,从image标签中正则匹配取出src标签的内容,java代码,从image标签中正则匹配取出src标签的内容

    Java正则表达式[web输入验证]

    Java正则表达式[web输入验证&lt;身份证,邮箱,URL,手机号等&gt;]

    获取网页表格数据 正则表达式

    获取网页表格数据 &lt;tr&gt; &lt;td&gt;正则表达式 获取网页表格数据 &lt;tr&gt; &lt;td&gt;正则表达式

    文件路径的正则表达式

    其中包括windows和linux文件路径的正则表达式;去除空格和斜杠转换的replaceall方法

    常用java正则表达式

    如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一...

    正则表达式(regular expression)

    正则表达式(regular expression) &lt;br/&gt; 原著:笑容&lt;br/&gt; 创作于:2004年05月03日&lt;br/&gt;最后更新:2004年05月04日 21:12&lt;br/&gt;引用地址:正则表达式(regular expression)&lt;br/&gt;版权声明:使用创作公用版权协议&lt;br/&gt; ...

    正则表达式 正则表达式 正则表达式

    正则表达式,正则表达式,正则表达式 正则表达式 正则表达式 正则表达式 正则表达式 正则表达式 正则表达式

    常用正则表达式 正则表达式

    常用正则表达式 正则表达式 常用正则表达式 正则表达式

    正则表达式经典实例

    学习如何在uRL、路径、标记语言和数据交换中使用正则表达式; 学习更高深的正则表达式特性中的微妙之处; 理解在不同语言中正则表达式的API、语法和行为之间的区别; 创建更好的正则表达式来满足个性化的需求。 ...

    Java使用正则表达式提取XML节点内容的方法示例

    主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作技巧,需要的朋友可以参考下

    使用正则表达式的模式匹配

    JavaScript的RegExp类表示正则表达式,而String和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。 ECMAScript v3对JavaScript正则表达式进行了标准化。JavaScript 1.2实现了ECMAScript v3...

    JS正则表达式的使用以video标签为例

    使用JS正则表达式,选取video元素的src属性的值,利用jQuery选取元素

    正则表达式正则表达式

    正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式正则表达式...

    正则表达式验证工具,正则表达式校验工具

    正则表达式验证工具 V1.0 本软件主要用于检测正则表达式是否正确。 运行环境:本软件为绿色软件,无需安装,但需要Microsoft .NET Framework 4 支持,如果没有请前去下载(下载路径:...

    jJAVA正则表达式替换字符

    本资源文件是我自己总结的,其中包括5个类,这5个类的代码基本概括了java正则表达式替换String的多种情况,比如获取某个文件路径中盘符/后边的部分内容,提取"&lt;title&gt;XXXX&lt;/title&gt;"中的文字XXXX,用正则表达式获取指定...

    学习正则表达式-Michael+Fitzgerald.pdf

    《学习正则表达式》从正则表达式的基本概念讲...此外,书中各在线和桌面工具一应俱全,并介绍了进阶参考资料,是一本不可多得的正则表达式入门好书。《学习正则表达式》适合对正则表达式感兴趣的程序员和互联网从业者。

    正则表达式.rar正则表达式.rar正则表达式.rar正则表达式.rar正则表达式.rar

    正则表达式.rar正则表达式.rar正则表达式.rar正则表达式.rar

    pb 使用正则表达式源码pbregexp

    pb 使用正则表达式源码pbregexp pb中使用正则表达式组件,通过该组件可以在pb脚本中使用功能强大的正则表达式

    Java正则表达式 Java 正则表达式

    Java正则表达式Java正则表达式Java正则表达式Java正则表达式

Global site tag (gtag.js) - Google Analytics