`
biaowen
  • 浏览: 72990 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

nutch研究记录2(搜索器配置)

阅读更多

2.    搜索器配置。
    a)    将nutch-1.0.war部署到tomcat上,第一次部署tomcat会报错,没关系,因为还没进行配置,我们目的在于解压出nutch-1.0,呵呵。
    b)    打开搜索器目录(我们称为web nutch),配置WEB-INF/classes/nutch-site.xml,

<property>
	    <name>searcher.dir</name>
	    <value>E:/java/CoreJava/IndexSearchAbout/nutch-1.0/crawled</value>
</property>
 

    c)    现在启动web nutch应该就没问题了,不过搜索中文时候会出现乱码,可以修改tomcat/conf/server.xml来解决

<!--
    <Connector port="8080" protocol="HTTP/1.1" 
               connectionTimeout="20000" 
               redirectPort="8443" />
 -->
<Connector port="8080" 
     		maxThreads="150" 
     		minSpareThreads="25" 
     		maxSpareThreads="75" 
     		enableLookups="false" 
     		redirectPort="8443" 
     		acceptCount="100" 
     		debug="0" 
     		connectionTimeout="20000" 
     		disableUploadTimeout="true" 
     		URIEncoding="UTF-8" 
     		useBodyEncodingForURI="true" />
 

这里需要提醒一下,如果同一机器上同时运行搜索器和爬虫时候,当爬虫抓取数据保存到索引时候会抛出异常,因为有些索引文件被搜索器锁定,所以操作不了,导致异常!

分享到:
评论

相关推荐

    eclipse配置nutch,eclipse配置nutch

    eclipse配置nutch,eclipse配置nutch

    图解搜索引擎nutch配置

    图解搜索引擎nutch配置,自己制作的教程。因为在网上搜索到的教程很多都是粗略,对于初学nutch搜索引擎很难配置好,所以自己亲自打造了一篇图解教程!希望你能够配置成功!

    开发基于 Nutch 的集群式搜索引擎

    介绍 Nutch 的背景知识,包括 Nutch 架构,爬虫和搜索器。然后以开发一个基于 Nutch 的实际应用为例向读者展示如何使用 Nutch 开发自己的搜索引擎。在该示例中,首先带领读者开发一个作为 Nutch 爬虫抓取的目标网站...

    搜索引擎nutch配置

    这里是在网上搜到的Nutch配置的博客,比较详细,担心自己以后配置的时候忘了,所以传到csdn,顺便分享给大家。

    基于lucene和nutch的开源搜索引擎资料集合

    其中内容均为前段时间研究开源搜索引擎时搜集参考的资料,非常齐全包含的内容有: Computing PageRank Using Hadoop.ppt Google的秘密PageRank彻底解说中文版.doc JAVA_Lucene_in_Action教程完整版.doc Java开源搜索...

    基于nutch的搜索系统研究 论文

    基于nutch的搜索系统研究 硕士论文……………………………………………………………………………………

    Nutch搜索引擎·Eclipse开发配置(第4期)

    1.1 环境准备 ...1.1.3 JDK 安装配置 1.1.4 ANT 安装配置 1.1.5 IvyDE 安装配置 1.1.5 Tomcat 安装配置 1.1.6 Cygwin 安装配置 1.2 Eclipse 开发 1.2.1 Solr 部署 1.2.2 Nutch 导入 1.2.3 Solr 与Nutch 结合

    nutch_1.4配置

    nutch 1.4 在windows下安装配置

    Nutch中文分词插件的编写与配置

    Nutch中文分词插件的编写与配置,由于Internet的迅猛发展,使得用户查找信息犹如大海捞针,而搜索引擎则能帮用户很好的解决这个问题。 Nutch是用java语言开发的,基于Lucene的完整的网络搜索引擎,并采用插件机制进行...

    基于Nutch的搜索引擎系统的研究与实现

    基于Nutch的搜索引擎系统的研究与实现

    Nutch搜索引擎的页面排序修改方法研究.kdh

    Nutch是一个优秀的开放源代码的Web...分析开源搜索引擎Nutch代码,研究了Nutch的页面排序方法。在Nutch原有的结构基础上提出了3种修改Nutch 排序的方法,对每种方法的实现进行了阐述,最后对这些方法的特点进行了比较

    Nutch搜索引擎(1-5期)

    Nutch搜索引擎·Nutch简介及安装(第1期) Nutch搜索引擎·Solr简介及安装(第2期) Nutch搜索引擎·Nutch简单应用(第3期) Nutch搜索引擎·Eclipse开发配置(第4期) Nutch搜索引擎·Nutch浅入分析(第5期)

    nutch安装配置文档

    Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。

    Nutch 配置

    Nutch1.6的编译配置过程,详细介绍了Nutch1.6的下载到安装运行过程。

    nutch_1.4在windows下安装配置.pdf

    nutch1.4 在windows下的安装配置环境搭建

    Linux下Nutch单机配置

    Linux 下 Nutch 单机配置

    nutch配置nutch-default.xml

    nutch配置nutch-default.xml

    Nutch_的配置文件

    Nutch的配置文件主要有三类: 1.Hadoop的配置文件,...2.Nutch的配置文件,Nutch-default.xml和Nutch-site.xml。 3.Nutch的插件的配置文件,这些插件的配置文件在加载插件的时候由插件自行加载,如filter的配置文件。

    Lucene+nutch搜索引擎开发(全本2-2)

    Lucene+nutch搜索引擎开发(全本2-2),本电子书共两部分

Global site tag (gtag.js) - Google Analytics