`
nickdine
  • 浏览: 44237 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

分析页面 提取email地址 程序

阅读更多
下载一个论坛的帖子 存有很多email地址 类似那种 给email 散书的那种帖子就可以 到d盘
比如  http://topic.csdn.net/t/20020908/19/1006665.html
emailPage.html


package i.tommy.test.Test;

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class emailGetTest
{

	public static void main(String[] args)
	{
 		try
		{
			BufferedReader reader = new BufferedReader(new  FileReader("D:\\emailPage.htm"));
		    String line = "";
		    while ((line = reader.readLine()) != null)
			{
				  parseLine(line);
			}
		} catch (FileNotFoundException e)
		{
			e.printStackTrace();
		} catch (IOException e)
		{
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}

	private static void parseLine(String line)
	{
		Pattern pattern=Pattern.compile("[\\w[._]]+@[\\w[._]]+\\.[\\w]+");
		Matcher m=pattern.matcher(line);
		while (m.find())
		{
			System.out.println(m.group());
		}
	}
}



结果

yue621@sohu.com
wr_van@163.com
clingsii@sina.com
mcl525@163.com
wgzd5@xinhuanet.com
windfly523@sina.com
p4nt1um@sohu.com
eshower@sina.com
ntqgh@sohu.com
cncaoyna@hotmail.com
handsome1234@263.net
tllove@263.net
wangrui666cn@yahoo.com.cn
sdx_none@163.com
lcl101@163.com
eureka0891@163.com
xdyanzg@chinaren.com
iamathere@yahoo.com
liye_2000_0@sina.com
bigsnow2000@163.com
imani@163.com
pdy77@163.com
ccch@vip.sina.com
petwen@21cn.com
vvyjp@163.com
wzmb_wll@163.com
jb81613@hotmail.com
oliver@cqeway.com
jyd119@163.com
xufengxufeng@etang.com
lc_peng@yeah.net
happyboy221@china.com.cn
wwf_hl@cmmail.com
kbsoft@etang.com
bush@tclking.com
hdd618@hotmail.com
bo_oy@163.com
marsbaty@163.com
unluckybaby@hotmail.com
godofbruce@yahoo.com.cn
gujoy@spaceon.com
791537@163.com
mnetease@163.net
ccwangtao@sohu.com
gemway@btamail.net.cn
huzigege@163.net
wenky2@163.com
martin@whidc.com
ybjhyr@163.com
ybjhyr@163.com
ybjhyr@163.com
byle82@163.com
haojuliu@sina.com
zou_chao@cctk.net
yuyes@163.com
taojiebin@21cn.com
lwh1999@hotmail.com
luosha1980@hotmail.com
19799197zp@163.com
seairll@163.com
xu_siyu@21cn.com
mildv7@163.com
youso@sohu.com
vcsdk@163.com
rolandluo@163.net
hua315@163.com
zhou.lian@chinatmn.com
wolfsky1994@yahoo.com.cn
hillhero789@sina.com
clingsii@sina.com
radiowyg@yahoo.com.cn
ccwangtao@sohu.com
huangfaye@sina.com
feng.ww@163.com
yuds@vip.sina.com
liuhuashun@163.com
baijie606@163.com
sea@163.com
stu99@163.net
zaowei21@163.com
jawsy@yeah.net
jjsunbin2000@sina.com
youyuandirizi@sina.com
hotwang@963.net
angel_mine@163.com
fagn2000@sina.com
gsp396@2163.com
tccb@eyou.com
linux007@21cn.com
dalcon@vip.sina.com
athenaym@sina.com
yangjunzheng@163.net
zke21@yahoo.com.cn

哥下一步是不是要发垃圾邮件了?? 呵呵
分享到:
评论

相关推荐

    小程序-提取页面Email

    自己写的,提取页面Email的小工具,只要在seed.txt里添加一个url做种子,程序就会自动便利所有链接,并提取页面的Email数据,存入email.txt中

    emailextractor:Chrome扩展程序,用于提取电子邮件地址

    要提取它们,必须满足页面上数据格式的特定条件: 数据必须驻留在表中。 每个表格行必须在其中一个单元格中包含一个电子邮件地址。 每个表格行必须包含一个带有选中复选框的单元格。 =)保罗,我知道了!指令npm ...

    电子邮件提取器「Email Extractor」-crx插件

    该工具将启动一个机器人,该机器人将访问请求的页面并提取在这些网页上找到的所有电子邮件地址 **自动保存:此功能将在您访问的所有页面上找到的所有电子邮件ID存储在云中。该插件从源代码中获取电子邮件ID,并且与...

    web-email-extractor:.NET控制台应用程序,用于从通过CSV文件提供的一组网站的标记中提取所有唯一的电子邮件地址

    该应用程序扫描主页和直接子页面的所有标记,并通过使用正则表达式来标识电子邮件地址。 动机 作为自由开发人员,我一直需要新的潜在客户。 产生线索的一种方法是冷引线。 为此,我使用Google来确定相关企业的列表...

    Email Hunter-crx插件

    语言:English,русс...功能:-从访问的页面提取电子邮件-自动搜索-将收集到的电子邮件导出到文本文件并复制到剪贴板隐私权政策:https://docs.google.com/document/d/18F_ZZZlML8cE846l4gfPB81JUeLLMLTLtPZt5OsN2YA

    网页验证码提取工具

    一个用delphi写的 网页验证码提取工具,本工具是针对《赶集网(www.ganji.com)》的信息发布页面的验证码而写的,此演示版不能从网页里直接提取验证码,如有需要请与作者联系。QQ:309867165,email:xcplates@163....

    Email Extractor-crx插件

    语言:English 强大的扩展功能,可从网页自动提取电子邮件ID。 新功能:自动访问网站和自动保存电子邮件ID。...该工具将启动一个机器人,该机器人将访问请求的页面并提取在这些网页上找到的所有电子邮件地址。 **

    Email Exporter-crx插件

    *提取页面中的所有电子邮件地址。 *提取页面中的所有电话号码。 *将结果导出到文本文件。 *将结果复制到剪贴板。 *在页面和标签之间附加捕获的数据。 *通过HTML或页面文本搜索联系人。 *将结果保存到文件中或通过...

    Web Spider, Web Crawler, Email Extractor:使用JAVA Regex从Web免费提取电子邮件,电话和自定义文本-开源

    在“文件”中有支持MySql连接的WebCrawlerMySQL.jar。...爬网程序-从Web提取电子邮件,电话和自定义文本-导出到Excel文件-数据保存到Derby数据库中-用Java Cross Platform编写请参见此链接中的免费电子邮件发件人:...

    Python获取邮件地址的方法

    本文实例讲述了Python获取邮件地址的方法。分享给大家供大家参考。具体实现方法如下: import email.Utils  def getCleanMailAddress(strAddr):  emails = email.Utils.parseaddr(strAddr.lower())  return ...

    Free Email Hunter-crx插件

    当您访问页面时,Email Hunter可以轻松地从页面中提取电子邮件地址并自动保存它们。不管您在正面看到什么,此chrome应用程序都可以查找抓取和搜索源代码的电子邮件地址。隐私权政策:...

    Email Finder-crx插件

    语言:English Email Finder是一个Chrome扩展程序,可以自动提取当前页面中的所有电子邮件地址。 Email Finder是一个Chrome扩展程序,可以自动提取当前页面中的所有电子邮件地址。

    python_Company:从文本文件读取并抓取网络的程序

    在github上集成测试覆盖率徽章-从结果网址中选择带有正则表达式的Facebook网址-转到有关页面的facebook-使用正则表达式选择电子邮件-使用以下结构写到输出文件company_name:email company_name_2:email_2 限制。...

    Odha Email Extractor-crx插件

    odha zendesk电子邮件提取器 odha zendesk电子邮件提取器。 您可以根据页面的页面上从Zendesk刮擦/导出/导出/导出联系人。 扩展捕获它在Zendesk中找到的所有电子邮件。 延期一直在每10秒后访问下一页。 您可以选择...

    VB编程资源大全(源码 网络)

    92,email.ZIP 收发电子邮件(16KB) 93,search.ZIP 网络搜索(22KB) 94,zhuce.ZIP 远程注册程序(203KB) 95,mapdriver.zip 用VB影射网络驱动器、打开网络驱动器程序源(10KB) 96,i038_...

    Advanced Email Extractor-crx插件

    它将从每个页面提取电子邮件,也可以检查给定网站上的其他URL。 如果您确实需要简单,高级的电子邮件提取程序,则可以安装此扩展程序。 v1.00允许用户:-手动/自动从给定的URL及其子页面中提取电子邮件-将提取的数据...

    VB网络编程实例

    ◆ 171.htm 开发网络应用的5个技巧 ◆ 172.htm 利用RAS调用在VB6.0中实现拨号上网 ◆ 173.htm 利用VB提取HTML文件中的EMAIL地址 ◆ 174.htm 枚举出局域网上所有网络资源 ◆ 175.htm 面向...

Global site tag (gtag.js) - Google Analytics