`
xwf55xwf
  • 浏览: 13988 次
社区版块
存档分类
最新评论

用正则表达式做内容关键字链接

 
阅读更多

  private void rc()
  {
  string str1 = "网络技术网络;网络应用 网络基本知识 网络技术网络;网络应用 网络基本知识";
  List keys = new List();
  keys.Add("网络");
  keys.Add("网络技术");
  keys.Add("网络基本");
  string result = keyAddUrl(str1, keys," http://www.baidu.com/");
  this.Label1.Text = result;
  }
  /// 
  /// 给关键字加链接,同一关键字只加一次
  /// 
  /// 源字符串
  /// 关键字泛型
  /// 链接地址
  /// 替换后结果
  private string keyAddUrl(string src, List keys ,string URL)
  {
  Regex reg = new Regex(@"(?i)(?:^|(?[^]*))>)(?>[^]*)(?:= 0; i--)
  {
  temp = Regex.Replace(temp, @"(?is)^((?:(?:(?!" + Regex.Escape(keys[i]) + @"|)*(?:(?!" + Regex.Escape(keys[i]) + @"|" + Regex.Escape(keys[i]) + @")", @"$1${tag}");
  if (length != temp.Length)
  {
  keys.Remove(keys[i]);
  }
  length = temp.Length;
  }
  return temp;
  });
  }
分享到:
评论

相关推荐

    PHP正则表达式替换站点关键字链接后空白的解决方法

    主要介绍了PHP正则表达式替换站点关键字链接后空白的问题解决,需要的朋友可以参考下

    正则表达式

    无论是用正则表达式直接量还是用构造函数RegExp(),创建一个RegExp对象都是比较容易的.较为困难的任务是用正则表达式语法来描述字符的模式. JavaScript采用的是Perl语言正则表达式语法的一个相当完整的子集. 正则...

    使用 js+正则表达式为关键词添加链接

    主要介绍了使用 js+正则表达式为关键词添加链接,十分的简单,需要的朋友可以参考下

    疯狂网页 抓取工具

    2、删选含有某些关键字的网页,支持多个正则表达式,以空格分隔 3、刷新某个具体的链接 4、抓图某个网页上的图片,并支持递归扩展 5、测试正则表达式 [version 0.1.0.1] -- 2014.04.30 1、第一个发行测试版 完成...

    一个java正则表达式工具类源代码.zip(内含Regexp.java文件)

    * Summary of regular-expression constructs 正则表达式结构简介: * Construct Matches * Characters 字符: * x The character x x 字符 x * \\ The ...

    网页监视器专版—自动监视网页上感兴趣的内容

    Pattern(url_target):您感兴趣的关键字对应的链接地址正则表达式,@title@可以表示提取到的关键字 页面编码:网页编码,因为懒不想写,所以手动填写之 监视记录:在网页上找到的您感兴趣的内容,双击列表项可以...

    飞影网页采集爬行系统 v1.0.12

    GRETA,最快速的正则表达式引擎;Windows自带IE控件,轻松实现登录采集,代理采集等;采集条目自定义,不局限于标题和正文的采集模式,支持多页采集;采集条目预设三种标记匹配模式,不熟悉正则表达式仍可完成采集;...

    Python实现查百度收录

    提取结果:使用正则表达式或其他合适的方式从返回的网页内容中提取出需要的信息,如收录数量、具体收录链接等。 输出结果:将提取的结果进行输出,可以打印到控制台或保存到文件中,以便后续查看和分析。 请注意,...

    方便淘宝资讯小偷源码 v1.0 [商业版].rar

    由于百度没有收录淘宝的任何内容页面,所以数据都为原创,seo良好!!!  方便淘宝资讯小偷程序v1.0[商业版] 需知 ... $tongji 统计 (需要正则表达式,不然会导致整个网站无效)  $shouquan 授权码 需授权文件配合

    新闻信息整合与检索系统.zip

    从数据库中收集的 url 出发,利用 BeautifulSoup4 和 正则表达式 逐条寻找每篇新闻的发布时间 date 和新闻全文 text ,并对在采集过程中可能出现的错误进行了预处理,避免运行时报错,降低效率。 第三部分: 对...

    tg-keyword-reply-bot:电报关键字自动回复机器人:根据类别管理员设置的关键字或者正则规则,自动回复文字,图片,文件或者进行永久禁言,临时禁言,踢出等群管操作

    开源版本基本命令添加关键词回复规则/add 关键词===回复内容或者/add 关键词1||关键词2===回复内容关键词可以使用正则表达式,例如/add re:p([az]+)ch===测试正则,就会匹配规则p([az]+)ch删除关键词规则/del 关键词...

    MATLABMYSQL爬虫-zhgd.m

    2.根据抓取的对象html特征,制定不同的正则表达式筛选出需要的内容  2.1类别:提前的关键字,用\连接,组成创建目录的格式,mkdir函数创建目录  2.2图片:提取图片地址,判断图片数量,去前缀,补充链接,使用...

    基于selenium的新浪微博关键字搜索结果全自动爬虫.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    亚马逊商品爬虫,根据搜索关键字爬取.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    基于电商网络的数据采集与分析毕业论文(33页12525字数).docx

    本论文将使用Python语言,在PyCharm开发环境中去编写爬虫程序,通过selenium启动代理浏览器,在搜索文本框中输入搜索关键字,从Web服务器调用Web爬虫模块,接着爬虫模块检查Internet连接,如果网络连接成功,就处理...

    javascript文档

    ignoreCase 属性 返回一个 Boolean 值,标记正则表达式使用的 ignoreCase 标志状态 (i)。 递增运算符(++) 给变量加一。 index 属性 返回在字符串中找到的第一个成功匹配的字符位置。 indexOf 方法 返回在 ...

    SPOI过滤器「SPOI Filter」-crx插件

    SPOI过滤器 - 可让您隐藏和突出显示RSS消息项目的Feedly和Old Reader by关键字或正则表达式。 过滤器基于付费订阅模式。许可的用户将每月收费0.99美元。还有6个月和12个月的订阅,以及试用许可。 我们都喜欢用我们的...

    JScript 语言参考

    ignoreCase 属性 返回一个 Boolean 值,标记正则表达式使用的 ignoreCase 标志状态 (i)。 递增运算符(++) 给变量加一。 index 属性 返回在字符串中找到的第一个成功匹配的字符位置。 indexOf 方法 返回在 ...

Global site tag (gtag.js) - Google Analytics