C#、JS利用正则表达式清理HTML标记一例

博客分类：

有些时候，我们对一些内容，清理掉HTML标记，只保留纯内容或一部分内容，例如下面的一段：

对上面的这段代码，我们只要蓝色的内容，也就是“凡是被HTML标记包围的内容，都不要了 ”

C# 的实现方式：

string 
strToBeFiltered = "<SPAN class  =  InsertWordsDisplay>这里不要</span>只要这里<SPAN class=\"InsertWordsDisplay\">不要(*)</span>"
;
Regex 
reg = new 
Regex
("<span\\s+class\\s{0,}=\\s{0,}\"{0,1}InsertWordsDisplay\"{0,1}>.+?</span>"
, RegexOptions
.IgnoreCase | RegexOptions
.Multiline);
string 
strFiltered = reg.Replace(strToBeFiltered, ""
);

上面的 strFiltered 就是最终的结果了

Javascript 的实现方式：

<
script 
type
=
"text/javascript"
>
    
var 
strToBeFiltered 
= 
'<SPAN class  =  InsertWordsDisplay>不要</span>要<SPAN class="InsertWordsDisplay">不要(*)</span>'
;
    
var 
pattern 
= /<
span
\
s
+
class
\
s
{
0
,}=\
s
{
0
,}
"{0,1}InsertWordsDisplay"
{
0
,
1
}\
s
{
0
,}>.+?<\/
span
>/
ig
;
    
var 
strFiltered 
= 
strToBeFiltered
.
replace
(
pattern
, 
''
);
    
alert
(
strFiltered
);

</
script
>

希望起个抛砖引玉的作用吧

分享到：

C#、VB.NET 使用System.Media.SoundPlayer ... | C#、JS利用正则表达式清理HTML标记一例

2009-02-13 16:54
浏览 874
评论(0)
论坛回复 / 浏览 (0 / 2833)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

C#、JS利用正则表达式清理HTML标记一例

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

C#、JS利用正则表达式清理HTML标记一例

评论

发表评论

相关推荐

扩展WebClient支持gzip,deflate压缩页面的自解压，解决乱码问题

《asp.net 3.5 入门经典》PDF电子书中文第五版 下载

C#、VB.NET使用Windows API控制系统音量及静音

C#、VB.NET将自己的程序注册到系统的右键菜单(所有文件和目录)

C#将XML导入到ACCESS数据库

C#、VB.NET 使用System.Media.SoundPlayer播放音乐

C#、VB.NET使用HttpWebRequest访问https地址(SSL)的实现

C#利用mshtml的COM接口，将WebBrowser中的验证码图片读入内存

Windows Live Writer 插件开发的一点提示

C#使用HTTP头检测网络资源是否有效

C#获取图片某个点的RGB颜色值

CoolEmotion升级到2.5，新增表情一套(Windows Live Writer 表情插件)

QQ消息自动发送器（自动发广告、聊天，支持群，支持最新的QQ2008II Beta1） C# 版

WebBrowser控件禁用超链接转向、脚本错误提示、默认右键菜单和快捷键

Winform DataGridView中利用WebClient异步加载显示网络地址的图片

数学运算表达式形式的验证码 C# Asp.Net

Windows Liver Writer 表情插件 coolemotion 更新至 1.2 版

Web2.0 工具、资源网站汇

WebBrowser自动点击链接 广告自动点击 Ads Auto Click

Asp.Net Winform 条形码系列之Code39

最近访客更多访客>>

《asp.net 3.5 入门经典》PDF电子书中文第五版下载

WebBrowser自动点击链接广告自动点击 Ads Auto Click