`
Josh_Persistence
  • 浏览: 1633520 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
文章列表
前言:        如果你对Solr怎么和Tomcat 集成以及如何使用mmseg4j和自定义的词库丰富完善中文分词,可以参照我的其它与Solr相关的博客。这篇将以简练的方式给出如何搭建Solr5.x的服务(以截止目前为止最新的Solr5.3为例),而 ...
Field:    Field就是一个字段,定义一个Field很简单:     <field name="tile" type="string" indexed="true" stored="true"/>  Field的属性也和FieldType类似,他的属性会覆盖掉FieldType的同名属性。     CopyField        你可能想让document的一些字段可以多次使用。solr 有一个字段复制机制,可以提交多个不同类型字段集中到一个字段,如将title字段和con ...
前言        Solr在Lucene之上开发了很多Cache功能,目前提供的Cache类型有: (1)   filterCache (2)   documentCache (3)   fieldvalueCache   (4)   queryresultCache     一、Cache的生命周期        Solr查询的核心类是SolrIndexSearcher,每个core通常在同一时刻只由当前的SolrIndexSearcher供上层的handler使用(但当切换SolrIndexSearcher时可能会有两个同时提供服务),Solr的各种Cache正是依附 ...
LRU是Least Recently Used 近期最少使用算法。 内存管理的一种页面置换算法,对于在内存中但又不用的数据块(内存块)叫做LRU,操作系统会根据哪些数据属于LRU而将其移出内存而腾出空间来加载另外的数据。 什么是LRU算法? LRU ...
一、mmseg4j对Solr5.x的支持必须使用mmseg4j-2.0以上的版本,本例中我使用的是mmseg4j solr 2.3.0,使用的solr是截止目前为止的solr5.3.1,可下载附件,注意Solr-5.3.1是linux版本,如果需要windows版本,直接去官网上下载,so easy!   二、mmseg4j-2.0后的jar包只有两个了,一个是mmseg4j-core-1.10.0.jar和mmseg4j-solr-2.3.0.jar,而不再有 mmseg4j-analysi-*.jar,感兴趣的可以看我Solr其它专题的博客,里面有一个Solr4.7集成mmseg4 ...
        我们都知道,英文的分词由于单词间是以空格进行分隔的,所以分词要相对的容易些,而中文就不同了,中文中一个句子的分隔就是以字为单位的了,而所谓的正向最大匹配和逆向最大匹配便是一种分词匹配的方法,这 ...
一、怎样查看并停止某个进程   netstat -ano tskill [pid] 或者在任务管理器的进程中停止相关进程。 如:  协议  本地地址          外部地址        状态           PID  TCP    0.0.0.0:135            0.0.0.0:0              LISTENING       956 可看到端口135的进程id是956,于是可以使用tskill 956杀掉该进程。
一、概述 今天在eclipse中使用Jetty9.3.0的Embedded方法来启动一个web application的时候,出现了如下的exception: Exception in thread "main" java.lang.UnsupportedClassVersionError: org/eclipse/jetty/server/Connector : Unsupported major.minor version 52.0 在Java ...
一、简介            在Git中,有两种方法将两个不同的branch合并。一种是通过git merge,一种是通过git rebase。然而,大部分人都习惯于使用git merge
一、概述        泛型是Java SE 1.5的新特性,泛型的本质是参数化类型,也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口、泛型方法。 Java语言引入泛型的好处是安全简单。 在Java SE 1.5之前,没有泛型的情况的下,通过对类型Object的引用来实现参数的“任意化”,“任意化”带来的缺点是要做显式的强制类型转换,而这种转换是要求开发者对实际参数类型可以预知的情况下进行的。对于强制类型转换错误的情况,编译器可能不提示错误,在运行的时候才出现异常,这是一个安全隐患。 泛型的好处是在编译的时候检查类型安全,并且 ...
.tar  解包:tar xvf FileName.tar 打包:tar cvf FileName.tar DirName (注:tar是打包,不是压缩!) ——————————————— .gz 解压1:gunzip FileName.gz 解压2:gzip -d FileName.gz 压缩:gzip FileName .tar.gz 和 .tgz 解压:tar zxvf FileName.tar.gz 压缩:tar zcvf FileName.tar.gz DirName ——————————————— .bz2 解压1:bzip2 -d FileName.b ...
一、场景和需求 假设我现在有3个独立的用project(暂时用maven关联起来,当然也可以不用maven),一个是提供公共服务的infrastructure,一个是提供存储的persister,一个是提供搜索的searcher,其中提供基础服务的所有的类,例如DateUtils,HttpUtils等工具类都位于目录com.chuanliu.platform.activity下,而提供存储服务的所有类都位于com.chuanliu.platform.activity.persist目录下,提供搜索服务的所有类都位于com.chuanliu.platform.activity.solr下。 ...
一、Kafka的基本概述   1、Kafka是什么? kafka官网上对kafka的定义叫:A distributed publish-subscribe messaging system。publish-subscribe是发布和订阅的意思,所以准确的说kafka是一个消息订阅和发布的系统。最初,Kafka实际上是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运行日志(CPU、内存、磁盘、网络、系统及进程状态)。   2、Kafka能做什么? 现今,Kafa主 ...
<mirrors> <mirror> <id>repo2</id> <mirrorOf>central</mirrorOf> <name>Human Readable Name for this Mirror.</name> <url>http://repo2.maven.org/maven2/</url> </mirror> <mirror> ...
一、概述 Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库,Solr是以Lucene为基础实现的文本检索应用服务,SolrCloud是Solr4.0版本开发出的具有开创意义的基于Solr和Zookeeper的分布式搜索方案,主要思想是使用Zookeeper作为集群的配置信息中心。也可以说,SolrCloud是Solr的一种部署方式,除SolrCloud之外,Solr还可以以单机方和多机Master-Slaver方式进行部署。分布式索引是指当索引越来越大,一个单一的系统无法满足磁盘需求的时候,或者一次简单的查询实在要耗费很多时间的时候,我们就可以使用solr的分布式索引了。 ...
Global site tag (gtag.js) - Google Analytics