下载地址
经测试,实际用时1秒左右
private static final Pattern p = Pattern.compile("\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*");
public static ArrayList<String> extractEmail(int id,int start,int end){
ArrayList<String> list = new ArrayList<String>();
try {
for (int i = start; i <= end; i++) {
Parser parser = new Parser("http://tieba.baidu.com/p/"+id+"?pn="+i);
NodeFilter filter = new RegexFilter(
"\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*");
NodeList nodes = parser.extractAllNodesThatMatch(filter);
if (nodes.size() > 0) {
for (NodeIterator ni = nodes.elements(); ni.hasMoreNodes();) {
Matcher m = p.matcher(ni.nextNode().toHtml());
if (m.find()) {
list.add(m.group());
}
}
}
}
} catch (ParserException e) {
}
return list;
}
分享到:
相关推荐
使用HtmlParser 提取百度贴吧中的图片
HTMLParser提取网页超链接研究 HTMLParser提取网页超链接研究
HtmlParser提取网页信息的设计与实现
HTMLParser提取网页内容,提取网页正文及标题等内容
基于HTMLParser 信息提取的网络爬虫设计论文
主要介绍了java使用htmlparser提取网页纯文本例子,需要的朋友可以参考下
Java使用HtmlParser抓取网页数据并解析
HTMLParser.net源代码HTMLParser.net使用demo
网络爬虫HTMLParser使用举例,实际例子让你轻松掌握HTMLParser
META-INF/maven/org.htmlparser/htmlparser/pom.properties META-INF/maven/org.htmlparser/htmlparser/pom.xml org.htmlparser.Parser.class org.htmlparser.PrototypicalNodeFactory.class org.htmlparser.beans....
使用htmlparser制作的网页爬虫例题
JAVA htmlparser 使用实例
javajsp中使用HTMLParser htmlparser用于 对html页面进行解析,它是一个功能比较强大的工具。
HTMLParser使用文档和jar包
c#版htmlparser htmlparser.dll htmlparser源代码
HTMLParser使用详解
Java使用HtmlParser实现简单的网络爬虫,爬虫DEMO,Java 使用 HtmlParser 抓取网页数据并解析以及说明
htmlparser 使用指南 入门 必读htmlparser 使用指南 入门 必读htmlparser 使用指南 入门 必读htmlparser 使用指南 入门 必读