htmlcleaner惯用法

博客分类：

HtmlAnalysis

Common usage

Tipically the following steps are taken:

// create an instance of HtmlCleaner
HtmlCleaner cleaner = new HtmlCleaner();
 
// take default cleaner properties
CleanerProperties props = cleaner.getProperties();
 
// customize cleaner's behaviour with property setters
props.setXXX(...);
 
// Clean HTML taken from simple string, file, URL, input stream, 
// input source or reader. Result is root node of created 
// tree-like structure. Single cleaner instance may be safely used
// multiple times.
TagNode node = cleaner.clean(...);
 
// optionally find parts of the DOM or modify some nodes
TagNode[] myNodes = node.getElementsByXXX(...);
// and/or
Object[] myNodes = node.evaluateXPath(xPathExpression);
// and/or
aNode.removeFromTree();
// and/or
aNode.addAttribute(attName, attValue);
// and/or
aNode.removeAttribute(attName, attValue);
// and/or
cleaner.setInnerHtml(aNode, htmlContent);
 
// serialize a node to a file, output stream, DOM, JDom...
new XXXSerializer(props).writeXmlXXX(aNode, ...);
myJDom = new JDomSerializer(props, true).createJDom(aNode);
myDom = new DomSerializer(props, true).createDOM(aNode);

分享到：

HtmlCleaner API | htmlcleaner惯用法

2010-04-13 13:39
浏览 1421
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

htmlcleaner惯用法

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

htmlcleaner惯用法

评论

发表评论

相关推荐

htmlunit 示例

HTMLParser的两种使用方法

HtmlCleanner结合xpath用法

基于Htmlparser的天气预报程序（续）

httpclient（校内网）

httpclient（校内网）

HTTPClient模拟登陆人人网

HtmlCleaner API

htmlcleaner惯用法

htmlcleaner 使用示例.

http://htmlparser.com.cn/

开源网络蜘蛛spider（转载）

基于Spindle的增强HTTP Spider

Cobra: Java HTML 解析器

用htmlparser分析并抽取正文

HtmlParser初步研究

基于Htmlparser的天气预报程序

最近访客更多访客>>