`
- 浏览:
616321 次
- 性别:
- 来自:
杭州
-
java 代码
- public String html2Text(String inputString) {
- String htmlStr = inputString;
- String textStr ="";
- java.util.regex.Pattern p_script;
- java.util.regex.Matcher m_script;
- java.util.regex.Pattern p_style;
- java.util.regex.Matcher m_style;
- java.util.regex.Pattern p_html;
- java.util.regex.Matcher m_html;
-
- try {
- String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";
- String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";
- String regEx_html = "<[^>]+>";
-
- p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
- m_script = p_script.matcher(htmlStr);
- htmlStr = m_script.replaceAll("");
-
- p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
- m_style = p_style.matcher(htmlStr);
- htmlStr = m_style.replaceAll("");
-
- p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
- m_html = p_html.matcher(htmlStr);
- htmlStr = m_html.replaceAll("");
-
- textStr = htmlStr;
-
- }catch(Exception e) {
- System.err.println("Html2Text: " + e.getMessage());
- }
-
- return textStr;
- }
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
可以实现java过滤html标签、过滤指定标签等等
使用wxParse插件,在微信小程序过滤HTML标签,包括文字、图片所有的标签,只需三步完美呈现富文本内容
过滤含html标签的字符串 过滤含html标签的字符串 过滤含html标签的字符串 过滤含html标签的字符串 过滤含html标签的字符串 过滤含html标签的字符串 过滤含html标签的字符串 过滤含html标签的字符串
java正则表达式过滤html标签
Java 中 过滤Html标签
过滤HTML标签的方法之一,非常好用,可以根据自己的需求来过滤相应的标签
java过滤html,css,js标签工具类(UnHtmlScript),抓取页面内容去除标签样式信息
/// 去除HTML标记 /// /// <param name="NoHTML">包括HTML的源码 /// 已经去除后的文字 public static string NoHTML(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"[^>]*?>.*?...
过滤html标签的代码,如果只是把类似的标记统统去掉,并不需要考虑别的
NULL 博文链接:https://starbhhc.iteye.com/blog/2301355
Java正则表达式过滤html标签1[参考].pdf
主要介绍了js过滤HTML标签实现方法,以完整实例形式分析了JavaScript使用正则表达式过滤HTML标签的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
private string FilterHTML(string contents) { string strTmp =string.Empty; strTmp = System.Text.RegularExpressions.Regex.Replace(contents, "<(.[^>]*)>", ""); return strTmp; }
asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签
html标签过滤,可以在jsp页面直接调用标签
NULL 博文链接:https://hylong05.iteye.com/blog/560611
只有一个方法 传入要过滤的字符串 即可完成HTML标签的过滤操作 返回不带HTML标签的字符串 非常方便,且实用
主要介绍了C#正则过滤HTML标签并保留指定标签的方法,涉及C#针对页面HTML元素正则匹配与替换相关操作技巧,需要的朋友可以参考下
用于过滤html的标签,应用java语言,提取html中文本的部分