1、拉取 Solr 镜像;
docker pull solr:7.4.0
2、启动 Solr 容器,即可访问 http://ip:8983/ ;
docker run --name taotao-solr -d -p 8983:8983 -t solr:7.4.0
3、新建 SolrCore,名称为 collection1;
docker exec -it --user=solr taotao-solr bin/solr create_core -c collection1
4、为了方便后续修改配置,将容器 solr 文件拷贝本地 /usr/local/solr/ 路径下;
docker cp taotao-solr:/opt/solr/ /usr/local/ # 容器拷贝宿主机
5、设置中文分词 smartcn;
5.1 进入容器
docker exec -it taotao-solr /bin/bash
5.2 定位Solr7自带的中文分词器 smartcn 的jar包位置 /opt/solr/contrib/analysis-extras/lucene-libs;
5.3 进入创建的 solrcore: collection1 配置目录 /opt/solr/server/solr/collection1/conf ,修改 solrconfig.xml 添加 smartcn 包的 lib 标签;
solrconfig.xml
<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-\d.*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-clustering-\d.*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-langid-\d.*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-velocity-\d.*\.jar" />
添加
<lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lucene-libs" regex="lucene-analyzers-smartcn-7.4.0.jar" />
添加
<requestHandler name="/dataimport" class="solr.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
5.4 在 managed-schema
中最后一行添加中文分词的 FieldType ;
<fieldType name="cn_text" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
<field name="category" type="cn_text" indexed="true"/>
<field name="title" type="cn_text" indexed="true"/>
<field name="content" type="cn_text" indexed="true"/>
<field name="keytext" type="text_general" indexed="true" stored="false" multiValued="true"/>
<copyField source="title" dest="keytext"/>
<copyField source="content" dest="keytext"/>
5.5 新建 vi data-config.xml
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource driver="com.mysql.jdbc.Driver" url="jdbc:mysql://192.168.31.31:3306/db" user="root" password="password" />
<document> ####transformer="HTMLStripTransformer" 一定要选、否则导入时会出错
<entity name="subject1" transformer="HTMLStripTransformer" query="SELECT id,'报修维护' AS category , CONCAT(initiator,initiator_hourse_num,initiator_phone) AS title, content FROM t1">
<field name="id" column="id"/>
<field name="title" column="title" stripHTML="true"/>
<field name="category" column="title" stripHTML="true"/>
<field name="content" column="title" stripHTML="true"/>
</entity>
<entity name="subject2" transformer="HTMLStripTransformer" query="SELECT id,'报修维护' AS category , CONCAT(initiator,initiator_hourse_num,initiator_phone) AS title, content FROM t2">
<field name="id" column="id"/>
<field name="title" column="title" stripHTML="true"/>
<field name="category" column="title" stripHTML="true"/>
<field name="content" column="title" stripHTML="true"/>
</entity>
</document>
</dataConfig>
5.6jar包配置
/solr/dist$ cp solr-dataimporthandler-* /usr/local/solr/server/solr-webapp/webapp/WEB-INF/lib
cd /usr/local/solr/server/solr-webapp/webapp/WEB-INF/lib
wget http://url/mysql.jar
6.上传配置,重启solr服务
docker cp /usr/local/solr/server/solr/collection1/conf/solrconfig.xml taotao-solr:/opt/solr/server/solr/collection1/conf/solrconfig.xml
docker cp /usr/local/solr/server/solr/collection1/conf/managed-schema taotao-solr:/opt/solr/server/solr/collection1/conf/managed-schema
docker restart taotao-solr
分享到:
相关推荐
Linux安装单机版Solr
windows版本的单机solr,下载压缩包以后,解压有使用说明文档,启动tomcat后即可启动sorl了,访问地址http://127.0.0.1:8090/solr
自己搭建好的solr 7.5.0搜索引擎服务器,是单机版,给予java的,详细文档https://blog.csdn.net/qwqw3333333/article/details/84333510
用户使用时 会存在无法进入solr官网下载的情况,此附带安装包 和安装教程,教程为转载其他博主的,网上也有其他相关教程 https://blog.csdn.net/tgbsqliuying/article/details/51591039
搭建solr7.4单机版
该资源是安装solr单机版以及solr集群版的相关资源,包含IK中午呢分词器
Solr是一个全文检索服务器,它基于Lucene实现,Solr只需要进行配置就可以实现全文检索服务。此文档参考培训机构资料,适合初学者参考使用。
solr7.4 单机版 集群版搭建,全部linux环境。 包含集群设置IK分词器。自行搭建。真实有效。包含所需要的资源文件。
solr4.5下载、解压、部署说明,tomcat部署说明,IK中文分词部署说明
这本资料介绍了solr的单机模式,集群模式的安装和配置,以及一些和java等语言的集成。以及更新旧版本solr引擎的说明等等
亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,亲测可用,
单机版solr6的安装及ik中文分词器的配置,solr的简单介绍及solrj的简单应用
在Linux中如何搭建单机版的solr服务器(非常详细) --- 上篇-附件资源
SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式。
springboot-solr-demoSolr单机版配置,以及springboot和solr集成solr-4.10.3solr4.10.31: 安装说明,以及中文词库配置说明等solr:webapp,将该目录放到tomcat webapps 下可以直接运行无需过多配置。solr-6.6.6solr...
Spring-4.x+Solr-4.10.3+spring-data-solr-1.5.5.RELEASE整合配置配置、包含单机版及相关集群配置及操作代码示例
文件内含有solrcloud搭建需要的文件,内含:IK中文解析器、tomcat7.0、安装solr的文件solr4.10.3版本、zookeeper3.4.6版本。如需要请下载。也可以直接使用solr+tomcat搭建单机版的solr服务也可以。
Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式,这些方式部署的Solr不具有SolrCloud的特色功能。SolrCloud有几个特色功能:使用ZK进行集中配置。启动时可以指定把Solr的相关配置文件上传
solr单机版8082 zookeeper集群2881:3881-2883:3883 solr集群6060-6063 ftp图片服务器21 nginx代理图片路径9090 阿波罗配置中心 config-server8080 admin-server8090 portal8070 消息队列服务器 4369 5672,5671 25672...