1、SOLR4.2集成NUTCH1.6
wget http://archive.apache.org/dist/lucene/solr/4.2.0/solr-4.2.0.tgz
tar -xzvf solr-4.2.0.tgz
cd solr-4.2.0/example
复制nutch的conf目录中的schema-solr4.xml文件到solr/collection1/conf目录,改名为schema.xml,覆盖原来文件
修改solr/collection1/conf/schema.xml,在<fields>下增加:<field name="_version_" type="long" indexed="true" stored="true"/>
2、给SOLR4.2配置中文分词器word分词
参考https://github.com/ysc/word的Solr插件部分
3、运行SOLR4.2
启动SOLR4.2服务器: java -jar start.jar &
SOLR4.2 Web界面: http://host2:8983
4、运行NUTCH提交索引
运行solrindex命令:
bin/nutch solrindex http://host2:8983/solr data/crawldb -linkdb data/linkdb -dir data/segments
相关推荐
自从lucene和solr推出4.0版本后 ik分词的调用接口已经不适用了,虽说ik最新ff版适用于solr4.0 但是solr4.2出来之后发现又不适用了,本人花了一点功夫熟悉solr4.2的分词调用接口补写了一个IkTokenizerFactory类 经...
Nutch+solr + hadoop相关框架搭建教程
maven 整合solr4.2环境,另外整合了solr-data-import源码环境,资源10分,十分不贵!有需要的朋友请下载吧。花了我3个小时的时间整理的。下载后,使用maven导入即可使用,升级solr版本也比较方便。本环境使用了...
几乎全新搭建ssm+shiro+solr7+mybatis逆向+maven多项目初步搭建测试,只是大致框架,接下来自己写,下面是linux 下solr7+tomcat8+IK中文分词器 环境 https://download.csdn.net/download/laysolitary/10686971
solr4.9+tomcat+zookeeper集群
solr教程+实例
solr6.0+mysql+IK分词集成
tomcat8.5+solr7+IKAnalyzer5, 已经整合IKAnalyzer中文分词, 直接使用即可
Linux下配置完成的tomcat8+solr7.4+IK分词器,jdk版本需要使用1.8版本,端口设置的8983,如果有错误,请告知
solr8+tomcat9+实时批量更新数据库+ik中文分词器,solr所用的工具与需要的jar,最新版本
tomcat+solr3.6+mmseg4j 整合+使用例子
使用Solr3.2 + Paoding中文分词的搜索引擎 使用Demo 测试放在C盘根目录
tomcat8.5+solr7+IKAnalyzer5+ikpinyin直装版, 直接启动tomcat访问地址即可, 相关分词器已经配好, 详情见readme
solr 5.0.0 + tomcat7 安装 + IKAnalyzer中文分词操作, 步骤详细可用,包含 IKAnalyzer的jar
Solr3.2+mmseg4j-1.8.4中文搜索引擎 demo 在C盘根目录
solr4.7+中文分词器IK Analyzer 2012FF_hf1相匹配,本人测试可以使用
对于抓取的数据,进行去重,去标签,然后利用lucene 和 solr 进行索引和搜索。 课程的最大特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络...
这个主要是整合了solr的spring+hibernate+webservice的一个框架代码,给大家讲解了solr的批次汇入和增删改查方法的实现方式,给初学者一些代码参考,希望能够帮助大家
IK分词器jar包,亲测适用于solr5.5.1+jdk7。为什么不能提交免费资源了,选资源分的时候最少也是2分
单机版solr6的安装及ik中文分词器的配置,solr的简单介绍及solrj的简单应用