`
hujin1979
  • 浏览: 78784 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

关于java浏览器项目

阅读更多
  其实这个项目开始做在现在已经快一个月了,从中学习和发现的问题还是有点的。现在提供下载的版本已经可以扫描分析到国内外大多数,我估计应该90%以上的网站吧,呵呵

  可以对页面10种预定义元素进行分析填充相关属性,并分析页面内包含的JavaScript脚本和引用的JS脚本,并可将几乎所有包含的事件写入到你想要分析的页面元素。

  今天还构思出了对页面的IFRAME和FRAME的提取和分析,下一步将增加对AJAX的分析。
有兴趣的同志可以和我一起参与下一步,也是很重要的功能模块的设计,关于绑定元素事件后的脚本执行,我在HTMLELEMENT里面定义了两个抽象方法,每个元素子类都可以来实现对本身事件函数的调用了。这个项目对互联网WEB爬虫程序设计可以提供一点入门参考,如果能开启很多线程去按计划扫描不同类型的网站,并将相关信息检索,就是垂直搜索的雏形了。

  你们有什么好的建议都可以与我联系,我的邮箱:hujin1979@126.com。谢谢能有人一起探讨!

  接下来的一段时间,如果我有空的话,会对该项目我的设计的一些问题和大家讨论,看大家能不能对我的想法提出更好的改进建议。
分享到:
评论
1 楼 csrs 2008-08-14  
我目前正在研究这块内容,我想加入这个项目的开发QQ:48212605

相关推荐

Global site tag (gtag.js) - Google Analytics