`
will-vip
  • 浏览: 39873 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论

过滤html标签的代码

阅读更多

过滤html标签的代码

public   String html2Text(String inputString) {    
      String htmlStr 
=  inputString;  // 含html标签的字符串    
      String textStr  = "" ;    
      java.util.regex.Pattern p_script;    
      java.util.regex.Matcher m_script;    
      java.util.regex.Pattern p_style;    
      java.util.regex.Matcher m_style;    
      java.util.regex.Pattern p_html;    
      java.util.regex.Matcher m_html;    
          
      
try  {    
       String regEx_script 
=   " <[\s]*?script[^>]*?>[\s\S]*?<[\s]*?\/[\s]*?script[\s]*?> " // 定义script的正则表达式{或<script>]*?>[\s\S]*?<\/script> }    
       String regEx_style  =   " <[\s]*?style[^>]*?>[\s\S]*?<[\s]*?\/[\s]*?style[\s]*?> " // 定义style的正则表达式{或<style>]*?>[\s\S]*?<\/style> }    
          String regEx_html  =   " <[^>]+> " // 定义HTML标签的正则表达式    
           
          p_script 
=  Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);    
          m_script 
=  p_script.matcher(htmlStr);    
          htmlStr 
=  m_script.replaceAll( "" );  // 过滤script标签    
   
          p_style 
=  Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);    
          m_style 
=  p_style.matcher(htmlStr);    
          htmlStr 
=  m_style.replaceAll( "" );  // 过滤style标签    
           
          p_html 
=  Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);    
          m_html 
=  p_html.matcher(htmlStr);    
          htmlStr 
=  m_html.replaceAll( "" );  // 过滤html标签    
           
       textStr 
=  htmlStr;    
           
      }
catch (Exception e) {    
                  System.err.println(
" Html2Text:  "   +  e.getMessage());    
      }    
          
      
return  textStr; // 返回文本字符串    
    }     

来源:http://blog.csdn.net/dahaizisheng/archive/2007/09/13/1784018.aspx

分享到:
评论

相关推荐

    java过滤html代码

    通过正则表达式过滤到html中的标签,将内容保存下来

    php过滤危险html代码

    )&gt;/isU", //过滤 等可能引入恶意内容或恶意改变显示布局的代码,如果不需要插入flash等,还可以加入的过滤 "/(&lt;[^&gt;]*)on[a-zA-Z]+\s*=([^&gt;]*&gt;)/isU", //过滤javascript的on事件 ); $tarr = array( " ", ...

    java过滤html,css,js标签工具类(UnHtmlScript)

    java过滤html,css,js标签工具类(UnHtmlScript),抓取页面内容去除标签样式信息

    asp过滤实现过滤所有的HTML代码

    Function RemoveHTML(strText) ...asp过滤实现过滤所有的HTML代码,然后就是显示中文了,绝对的,找了好长时间呀,(原理就是找到这两个标签里的所标签全部删除,汗,啰嗦。) &lt;%=removehtml(rs('game'))%&gt;

    常用过滤、截取HTML代码

    包括常用过滤html标签、截取字符串及获得本页地址三大函数。 过滤html标签函数:如果只是把类似的标记统统去掉,并不需要考虑别的。 截取字符串函数:截取字符串并限制字符串长度,多于给定的长度 获得本页地址:...

    Aspnet中过滤html代码

    Asp.net中如何过滤html,js,css代码

    过滤html标签函数

    过滤html标签的代码,如果只是把类似的标记统统去掉,并不需要考虑别的

    过滤字符串中的HTML标签

    private string FilterHTML(string contents) { string strTmp =string.Empty; strTmp = System.Text.RegularExpressions.Regex.Replace(contents, "&lt;(.[^&gt;]*)&gt;", ""); return strTmp; }

    C#过滤HTML标签源码,使用的正则表达式

    只有一个方法 传入要过滤的字符串 即可完成HTML标签的过滤操作 返回不带HTML标签的字符串 非常方便,且实用

    php正则过滤html标签、空格、换行符的代码(附说明)

    复制代码 代码如下: $str=preg_replace(“/\s+/”, ” “, $str); //过滤多余回车 $str=preg_replace(“/&lt;[ ]+/si”,”&lt;“,$str); //过滤&lt;__(“&lt;“号后面带空格) $str=... //过滤html标签 $str=preg_replac

    jQuery过滤HTML标签并高亮显示关键字的方法

    本文实例讲述了jQuery过滤HTML标签并高亮显示关键字的方法。分享给大家供大家参考。具体如下: jQuery实现网页关键字过滤效果,将需要过滤的文字定义在JavaScript中,可定义多个,不过要修改JS代码为数组,这样可...

    php过滤HTML标签、属性等正则表达式汇总

    主要介绍了php过滤HTML标签、属性等正则表达式汇总,本文使用代码实例给出了过滤HTML内容的正则表达式,具体说明请参阅代码中的注释,本文对使用PHP做采集的朋友有比较大的作用,需要的朋友可以参考下

    Python使用正则表达式去除(过滤)HTML标签提取文字功能

    下面给大家介绍下Python使用正则表达式去除(过滤)HTML标签提取文字,具体代码如下所示: # -*- coding: utf-8-*- import re ##过滤HTML中的标签 #将HTML中标签等信息去掉 #@param htmlstr HTML字符串. def filter_...

    去html标签代码(asp)

    可以去除文章中的HTML代码,可以去除文章中的HTML代码

    PHP正则表达式过滤html标签属性(DEMO)

    过滤html标签在php中可以有内置的函数了,但它过滤的太干净了,我们就整理了一下些利用正则来过滤指定html标签的例子,具体如下所示。 采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性...

    js过滤HTML标签以及空格的思路及代码

    代码如下:function setContent(str) {str = str.replace(/&lt;...测试的时候发现这段代码不能过滤掉网页中空格字符(即: )。于是自己又改造了一下: 代码如下:function removeHTMLTag(str) { str = str.replace

    HTML表格生成Excel文件代码(纯前端)

    HTML表格生成Excel文件代码 纯前端 demo 可以做参考~~

    ASP.NET过滤HTML标签只保留换行与空格的方法

    本文实例讲述了ASP.NET过滤HTML标签只保留换行与空格的方法。分享给大家供大家参考。具体分析如下: 自己从网上找了一个过滤HTML标签的方法,我也不知道谁的才是原创的,反正很多都一样。我把那方法复制下来,代码...

    PHP中HTML标签过滤技巧

    在开发文章系统中正常需要用到HTML标签、JS脚本等其他脚本代码的过滤,稍微尝试了下,感觉简单的... 您可能感兴趣的文章:PHP删除HTMl标签的三种解决方法php过滤HTML标签、属性等正则表达式汇总php去除HTML标签实例PHP h

Global site tag (gtag.js) - Google Analytics