过滤html标签的代码
public
String html2Text(String inputString) {
String htmlStr
=
inputString;
//
含html标签的字符串
String textStr
=
""
;
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try
{
String regEx_script
=
"
<[\s]*?script[^>]*?>[\s\S]*?<[\s]*?\/[\s]*?script[\s]*?>
"
;
//
定义script的正则表达式{或<script>]*?>[\s\S]*?<\/script> }
String regEx_style
=
"
<[\s]*?style[^>]*?>[\s\S]*?<[\s]*?\/[\s]*?style[\s]*?>
"
;
//
定义style的正则表达式{或<style>]*?>[\s\S]*?<\/style> }
String regEx_html
=
"
<[^>]+>
"
;
//
定义HTML标签的正则表达式
p_script
=
Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
m_script
=
p_script.matcher(htmlStr);
htmlStr
=
m_script.replaceAll(
""
);
//
过滤script标签
p_style
=
Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
m_style
=
p_style.matcher(htmlStr);
htmlStr
=
m_style.replaceAll(
""
);
//
过滤style标签
p_html
=
Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
m_html
=
p_html.matcher(htmlStr);
htmlStr
=
m_html.replaceAll(
""
);
//
过滤html标签
textStr
=
htmlStr;
}
catch
(Exception e) {
System.err.println(
"
Html2Text:
"
+
e.getMessage());
}
return
textStr;
//
返回文本字符串
}
来源:http://blog.csdn.net/dahaizisheng/archive/2007/09/13/1784018.aspx
分享到:
相关推荐
通过正则表达式过滤到html中的标签,将内容保存下来
)>/isU", //过滤 等可能引入恶意内容或恶意改变显示布局的代码,如果不需要插入flash等,还可以加入的过滤 "/(<[^>]*)on[a-zA-Z]+\s*=([^>]*>)/isU", //过滤javascript的on事件 ); $tarr = array( " ", ...
java过滤html,css,js标签工具类(UnHtmlScript),抓取页面内容去除标签样式信息
Function RemoveHTML(strText) ...asp过滤实现过滤所有的HTML代码,然后就是显示中文了,绝对的,找了好长时间呀,(原理就是找到这两个标签里的所标签全部删除,汗,啰嗦。) <%=removehtml(rs('game'))%>
包括常用过滤html标签、截取字符串及获得本页地址三大函数。 过滤html标签函数:如果只是把类似的标记统统去掉,并不需要考虑别的。 截取字符串函数:截取字符串并限制字符串长度,多于给定的长度 获得本页地址:...
Asp.net中如何过滤html,js,css代码
过滤html标签的代码,如果只是把类似的标记统统去掉,并不需要考虑别的
private string FilterHTML(string contents) { string strTmp =string.Empty; strTmp = System.Text.RegularExpressions.Regex.Replace(contents, "<(.[^>]*)>", ""); return strTmp; }
只有一个方法 传入要过滤的字符串 即可完成HTML标签的过滤操作 返回不带HTML标签的字符串 非常方便,且实用
复制代码 代码如下: $str=preg_replace(“/\s+/”, ” “, $str); //过滤多余回车 $str=preg_replace(“/<[ ]+/si”,”<“,$str); //过滤<__(“<“号后面带空格) $str=... //过滤html标签 $str=preg_replac
本文实例讲述了jQuery过滤HTML标签并高亮显示关键字的方法。分享给大家供大家参考。具体如下: jQuery实现网页关键字过滤效果,将需要过滤的文字定义在JavaScript中,可定义多个,不过要修改JS代码为数组,这样可...
主要介绍了php过滤HTML标签、属性等正则表达式汇总,本文使用代码实例给出了过滤HTML内容的正则表达式,具体说明请参阅代码中的注释,本文对使用PHP做采集的朋友有比较大的作用,需要的朋友可以参考下
可以去除文章中的HTML代码,可以去除文章中的HTML代码
HTML表格生成Excel文件代码 纯前端 demo 可以做参考~~
过滤html标签在php中可以有内置的函数了,但它过滤的太干净了,我们就整理了一下些利用正则来过滤指定html标签的例子,具体如下所示。 采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性...
代码如下:function setContent(str) {str = str.replace(/<...测试的时候发现这段代码不能过滤掉网页中空格字符(即: )。于是自己又改造了一下: 代码如下:function removeHTMLTag(str) { str = str.replace
本文实例讲述了ASP.NET过滤HTML标签只保留换行与空格的方法。分享给大家供大家参考。具体分析如下: 自己从网上找了一个过滤HTML标签的方法,我也不知道谁的才是原创的,反正很多都一样。我把那方法复制下来,代码...
在开发文章系统中正常需要用到HTML标签、JS脚本等其他脚本代码的过滤,稍微尝试了下,感觉简单的... 您可能感兴趣的文章:PHP删除HTMl标签的三种解决方法php过滤HTML标签、属性等正则表达式汇总php去除HTML标签实例PHP h
java代码-正则去除HTML代码中的A标签