`
wangheid
  • 浏览: 36406 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Java 过滤 html、script、style 代码得到纯字符串 方法

    博客分类:
  • java
 
阅读更多

  1. /*** 
  2.  
  3. * @param content 内容String 
  4. * @param p >0 .位数 
  5. * @return @tale: 
  6. * @purpose:得到相应位数已过滤html、script、style 标签的内容 内容结尾 为... 
  7. * @author:Simon - 赵振明 
  8. * @CreationTime:Aug 25, 201011:07:06 AM 
  9. */  
  10. public static String getNoHTMLString(String content,int p){  
  11.     
  12.     if(null==content) return "";  
  13.     if(0==p) return "";  
  14.     
  15.     java.util.regex.Pattern p_script;   
  16.          java.util.regex.Matcher m_script;   
  17.          java.util.regex.Pattern p_style;   
  18.          java.util.regex.Matcher m_style;   
  19.          java.util.regex.Pattern p_html;   
  20.          java.util.regex.Matcher m_html;   
  21.           
  22.      try {   
  23.          String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";  
  24.          //定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script> }    
  25.          String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";   
  26.                //定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style> }    
  27.                String regEx_html = "<[^>]+>"//定义HTML标签的正则表达式    
  28.              
  29.                p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);   
  30.                m_script = p_script.matcher(content);   
  31.                content = m_script.replaceAll(""); //过滤script标签   
  32.                p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);   
  33.                m_style = p_style.matcher(content);   
  34.                content = m_style.replaceAll(""); //过滤style标签    
  35.              
  36.                p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);   
  37.                m_html = p_html.matcher(content);   
  38.                  
  39.                content = m_html.replaceAll(""); //过滤html标签    
  40.            }catch(Exception e) {   
  41.                    return "";  
  42.            }   
  43.     
  44.            if(content.length()>p){  
  45.             content = content.substring(0, p)+"...";  
  46.            }else{  
  47.             content = content + "...";  
  48.            }  
  49.     
  50.     
  51.     
  52.    return content;  
  53. }  
分享到:
评论

相关推荐

    xheditor-1.1.14

    说明:这个函数执行时返回的值为上传程序返回的msg变量,可能为字符串或者数组,若为字符串则直接代表url,若是数组,则必需包含一个url的变量,其它可由可开发者自定义 备注:1.0.0 beta2新添加 plugins:自定义...

    javascript过滤危险脚本方法

    下面是他们的字符串规则: 1、&lt;(script|link|style|iframe)(.|\n)*&lt;\/\1&gt;\s* 2、\s*on[a-z]+\s*=\s*(“[^”]+”|'[^’]+’|[^\s]+)\s*(?=&gt;) 3、\s*(href|src)\s*=\s*(“\s*(javascript|vbscript):[^”]+”|’\...

    freemarker总结

    有一种特殊的字符串称为raw字符串,被认为是纯文本,其中的\和{等不具有特殊含义,该类字符串在引号前面加r,下面是一个例子: ${r"/${data}"year""}屏幕输出结果为:/${data}"year" 转义 含义 ...

    ZendFramework中文文档

    13.3. 从网页上获得Feed 13.4. RSS Feed的使用 13.5. Atom Feed的使用 13.6. 单个Atom条目的处理 13.7. 修改Feed和条目结构 13.8. 自定义Feed和条目类 14. Zend_Filter 14.1. 简介 14.1.1. 什么是过滤器...

    PHP手册2007整合中文版

    String 字符串处理函数 CLXII. Subversion 函数 CLXIII. Shockwave Flash Functions CLXIV. Swish Functions CLXV. Sybase Functions CLXVI. TCP Wrappers Functions CLXVII. Tidy Functions CLXVIII. Tokenizer ...

    PHP5 完整官方 中文教程

    Strings — String 字符串处理函数 SVN — Subversion 函数 SWF — Shockwave Flash Functions swish — Swish Functions Sybase — Sybase Functions TCP Wrappers — TCP Wrappers Functions tidy — Tidy ...

    PHP函数参考手册大全

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量函数 CL. ...

    中文版PHP使用手册

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量函数 CL. ...

    PHP5中文参考手册

    Strings — String 字符串处理函数 SVN — Subversion 函数 SWF — Shockwave Flash Functions swish — Swish Functions Sybase — Sybase Functions TCP Wrappers — TCP Wrappers Functions tidy — Tidy ...

    经典收藏最全php5.0查询手册

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量函数 CL. ...

    php手册PHP5研究室编无乱码版本chm

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量...

    PHP手册(带评论版-2008-03-14).part2.rar

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量函数 CL. ...

    PHP手册(带评论版-2008-03-14).part1.rar

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量函数 CL. ...

    PHP5 开发手册 简体中文手册

    String 字符串处理函数 CXLVI. Shockwave Flash Functions CXLVII. Sybase Functions CXLVIII. TCP Wrappers Functions CXLIX. Tidy Functions CL. Tokenizer Functions CLI. Unicode Functions CLII. URL 函数 ...

    php手册.chm,php手册

    String 字符串处理函数 CXLIII. Sybase Functions CXLIV. TCP Wrappers Functions CXLV. Tidy Functions CXLVI. Tokenizer Functions CXLVII. Unicode Functions CXLVIII. URL 函数 CXLIX. Variable 变量函数 CL. ...

    php帮助文档,php。chm,php必备的中文手册

    String 字符串处理函数 CXLVII. Shockwave Flash Functions CXLVIII. Sybase Functions CXLIX. TCP Wrappers Functions CL. Tidy Functions CLI. Tokenizer Functions CLII. Unicode Functions CLIII. URL 函数 ...

    PHP官方手册中文版

    String 字符串处理函数 CLXII. Subversion 函数 CLXIII. Shockwave Flash Functions CLXIV. Swish Functions CLXV. Sybase Functions CLXVI. TCP Wrappers Functions CLXVII. Tidy Functions CLXVIII. ...

Global site tag (gtag.js) - Google Analytics