`
XiAoOMAn07
  • 浏览: 74841 次
  • 性别: Icon_minigender_1
  • 来自: 温州
社区版块
存档分类
最新评论

白云机场(数据抓取)

阅读更多
输入输出流,正则表达式的学习
(代码在 学习日志 网页数据抓取)
http://xiaooman07.iteye.com/admin/blogs/476798

看了下正则表达式(正则表达式30分钟入门教程)  ps:30分钟教程看了几个小时。。。最后证实作者在忽悠人,,居然在文章末尾向读者道歉。。。
作者如是说:

好吧,我承认,我骗了你,读到这里你肯定花了不止30分钟.相信我,这是我的错,而不是因为你太笨.我之所以说"30分钟",是为了让你有信心,有耐心继续下去.既然你看到了这里,那证明我的阴谋成功了.被忽悠的感觉很爽吧? - -#

    总的来说很感激作者,写的真的很好,而且有很多经典的例子,从简单到难,虽然最后的几个表达式稍微有点难,不过想通以后就有一种豁然开朗的感觉啦。正则表达式真的是非常强大的工具,匹配输入字符,匹配ip地址,匹配电话号码,大概也没有匹配不了的数据,也没有想不到的匹配方法吧,,。。

    从网上保存了很多网页下来,回寝室以后开始写正则表达式,,写很久想很久,最后匹配出来了,,第二天,再看表达式,,居然不知道自己在写些什么。。。。(不过总算是学会了java 正则表达式的运用)。

STEP
step1 :
从网上保存网页到本地,在本地试验正则表达式
http://xiaooman07.iteye.com/admin/blogs/476794
step2 :
将抓取到的数据输出到文本文档
http://xiaooman07.iteye.com/admin/blogs/476797
step3 :
输入url,从网页上抓取数据,输出到文本文档,并进行格式修正。。
http://xiaooman07.iteye.com/admin/blogs/476798
但是始终有个小问题,,

交易量(手)                                      交易金额(万元)  -------      为什么中间空了其他数据的两倍间隔啊。。。。。。


ps:在输入输出流结束一定不要忘记close();、、



分享到:
评论
1 楼 teaofnit 2009-09-25  
干的不错,下次把主要代码贴下。

相关推荐

Global site tag (gtag.js) - Google Analytics