`
uqortbsa
  • 浏览: 13996 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

nutch web页面的配置

阅读更多
解决nutch-1.0的Web前端搜索无结果

这个问题困扰我很久,无论怎么配置,搜索关键字,一直提示以下令人郁闷的信息:

第0-0项 (共有 0 项查询结果):

今天终于解决了。

nutch-1.1命令行中搜索有结果,但是到web前端搜索,始终无结果,很是郁闷,今天终于解决了。

(1)直接把nutch-1.1.war放到Tomcat目录下的webapps,启动tomacat;修改nutch-site.xml后必须重启tomcat。(每次修改Nutch-site.xml后请重启tomcat,再搜索)

nutch-site.xml必须配置以下参数:

<property>
  <name>http.agent.name</name>  必须配置,否则搜索不到结果  <value>nutch-1.0< alue>
  <description>HTTP 'User-Agent' </description>
</property>

<property>
  <name>searcher.dir</name>
  <value>D:\data< alue>         data是爬虫生成的目录。参数值请使用绝对路径
  <description>Path to root of crawl.</description>
</property>

data目录是爬虫生成的目录,下面有这些目录:
crawldb,
index,
indexes,
linkdb,
segments

(2)请保证tomcat的安装目录不要出现空格,否则搜索结果永远是0

我出现问题的地方就是这里,

我的tomcat安装路径是
D:\Program Files\Apache Software Foundation\Tomcat 6.0\webapps\nutch-1.0,

这里的空格有影响,导致无结果,很痛苦,请千万注意。

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/zklth/archive/2010/05/18/5605961.aspx
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics