`
peigang
  • 浏览: 166877 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

nutch二次开发环境搭建

    博客分类:
  • JAVA
阅读更多

本文在总结使用nutch1.2框架做二次开发实验中总结出开发环境的一些设置,详细步骤如下:

一、从apache网站下载apache-nutch-1.2-bin.zip。如果需要分析hadoop也可以顺便下载hadoop-0.21.0.tar.gz,解压以上两个文件。解压后文件分别为nutch-1.2、hadoop-0.21.0。

二、新建web工程,引入nutch-1.2.jar以及nutch-1.2/lib中(可根据需要筛选)的.jar文件。

三、拷贝plugins到src目录下。

四、nutch-1.2/conf中的文件拷贝到src目录下。

以上步骤完成后就可以在二次开发的代码中整合nutch以及hadoop了。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics