`

Java过滤html标签

阅读更多


方法一:
String oldStr="<label>abc</label>";
String newStr= oldStr.replaceAll("<([^>]*)>", "");


结果:
newStr=abc;


方法二:
	/**
	 * 过滤掉html标签
	 * 
	 * @param str
	 *            源字符串
	 * @return 过滤后字符串
	 */
	public static String filterHtml(String str) {
		String regxpForHtml = "<([^>]*)>"; // 过滤所有以<开头以>结尾的标签
		Pattern pattern = Pattern.compile(regxpForHtml);
		Matcher matcher = pattern.matcher(str);
		StringBuffer sb = new StringBuffer();

		boolean result1 = matcher.find();
		while (result1) {
			matcher.appendReplacement(sb, "");
			result1 = matcher.find();
		}
		matcher.appendTail(sb);
		return sb.toString();
	}
分享到:
评论
2 楼 ahomeeye 2012-09-26  
shanghaiwobama 写道
这个,,做什么用呢

肯定有用处的,可以用来获取html内容。做网页爬虫什么的需要用到。
1 楼 shanghaiwobama 2012-09-21  
这个,,做什么用呢

相关推荐

Global site tag (gtag.js) - Google Analytics