- 浏览: 473507 次
- 性别:
- 来自: 湖南
文章分类
- 全部博客 (201)
- j2ee (43)
- oracle (9)
- mysql (7)
- db2 (1)
- j2se (3)
- spring (1)
- hibernate (3)
- struts (0)
- Berkeley DB (0)
- linux (60)
- Apache2+PHP+MYSQL (2)
- solr (15)
- svn (1)
- IntelliJ Idea (1)
- eclipse,myeclipse (4)
- ant (2)
- vim (8)
- IT生活 (4)
- 测试 (6)
- lucene (4)
- shell (1)
- nutch (18)
- thread (1)
- hadoop (5)
- mapreduce (0)
- Python (4)
- 硬件 (1)
- database (1)
- maven (1)
- 正则表达 (0)
- 互联网 (1)
最新评论
-
youngcoder:
good job
HTTP协议头部与Keep-Alive模式详解 -
javazdq:
受教了 解释的不错。
lucene创建索引高级特性和索引创建参数优化 -
josico:
有几个问题想问下楼主1. LinkedBlockingQueu ...
生产者-消费者-BlockingQueue -
annybz:
有没有关于 BlockingQueue和ConcurrentL ...
生产者-消费者-BlockingQueue -
uniquejava:
多谢,记录的很真实。
DB2 学习记录
Solr 1.4 有了对字段的分词。FieldAnalysisRequestHandler 可以对某个字段或字段类型的分词器对查询串取到分词数据。
用 solr 的默认配置,如 solr 1.4.0。
我用 mmseg4j 为例。在 solr.root/example/solr/conf/schema.xml 的 types 元素内加:
- <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
- <analyzer>
- <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"/>
- </analyzer>
- </fieldType>
把 IKAnalyzer -3.2.8.jar 放到 solr.home/example/solr/lib,没有 lib 目录,创建一个。更多关于 solr 中使用 mmseg4j 的内容请看:solr 中文分词 IKAnalyzer 使用例子。
如:“北京烤鸭
”
http://localhost:6091/solr-web-shop/shop/analysis/field?q=北京烤鸭&analysis.fieldtype=text&indent=on&wt=json
{
-
responseHeader : {
-
status : 0 ,
-
QTime : 3
-
-
analysis : {
-
field_types : {
-
text : {
-
query : [
-
"org.wltea.analyzer.lucene.IKTokenizer" ,
-
[
-
{
-
text : "北京烤鸭" ,
-
start : 0 ,
-
end : 4 ,
-
position : 1 ,
-
positionHistory : [
-
1
-
-
type : "word"
-
-
{
-
text : "北京烤" ,
-
start : 0 ,
-
end : 3 ,
-
position : 2 ,
-
positionHistory : [
-
2
-
-
type : "word"
-
-
{
-
text : "北京" ,
-
start : 0 ,
-
end : 2 ,
-
position : 3 ,
-
positionHistory : [
-
3
-
-
type : "word"
-
-
{
-
text : "烤鸭" ,
-
start : 2 ,
-
end : 4 ,
-
position : 4 ,
-
positionHistory : [
-
4
-
-
type : "word"
-
-
-
"org.apache.lucene.analysis.synonym.SynonymFilter" ,
-
[],
-
"org.apache.lucene.analysis.StopFilter" ,
-
[],
-
"org.apache.lucene.analysis.LowerCaseFilter" ,
-
[],
-
"org.apache.solr.analysis.RemoveDuplicatesTokenFilter" ,
-
[]
-
-
-
-
field_names : { }
-
}
代码实现:
public static void main(String[] args) throws MalformedURLException, SolrServerException, IOException { CommonsHttpSolrServer solrServer = new CommonsHttpSolrServer("http://localhost:6091/solr-web-shop/shop"); FieldAnalysisRequest request = new FieldAnalysisRequest("/analysis/field"); request.addFieldName("shopName"); request.setFieldValue("text"); request.setQuery("北京烤鸭"); FieldAnalysisResponse response = request.process(solrServer); System.out.println(response.toString()); Iterator it = response.getFieldNameAnalysis("shopName").getQueryPhases().iterator(); while(it.hasNext()) { AnalysisPhase pharse = (AnalysisPhase)it.next(); List<TokenInfo> list = pharse.getTokens(); for (TokenInfo info : list) { System.out.println(" text : "+ info.getText()); } } }
发表评论
-
Maven使用deploy命令部署构建
2012-07-18 17:13 2425个人技术博客:http:/ ... -
Java 对象序列化您不知道的 5 件事
2012-07-04 14:56 1361个人技术博客:http://demi-panda.com ... -
对Lucene PhraseQuery的slop的理解
2012-06-12 10:55 1534所谓PhraseQuery,就是通过短语来检索,比如我想查“b ... -
Apache Lucene 和 Solr 进行位置感知搜索
2012-04-26 18:26 1135个人技术博客:http://demi-panda.com ... -
Lucene Similarity (Lucene 文档评分score机制详解)
2012-04-06 16:06 1804个人博客:http://demi-panda.com ... -
地图经纬度距离计算
2012-03-30 15:43 2371public static final doubl ... -
ThreadLocal类
2012-03-01 18:38 901个人技术博客:http://demi-panda.com ... -
Solr Replication
2012-02-21 17:41 3118个人博客:http://demi-pand ... -
Solr 同义词搜索 synonyms
2012-02-09 18:30 2572个人技术博客:http://demi-panda.com ... -
解决 – java.lang.OutOfMemoryError: unable to create new native thread
2012-01-16 20:27 2729一、认识问题: 首先我们通过下面这个 测试程序 ... -
Spring MVC中默认的ResponseBody为String的乱码问题
2011-12-22 16:54 1381个人技术博客:http://demi-panda.com ... -
Solr合并索引方式
2011-12-09 15:41 38561, Solr 合并索引数据有 ... -
Solr Faceted
2011-11-26 17:07 1152http://www.lucidimagination.com ... -
SolrOperationsTools使用
2011-10-18 17:41 1093basic Solr scripts These sc ... -
ASCII和中文互转
2011-07-29 13:34 3782个人技术博客:http://demi-panda.com ... -
JVM 参数详解
2011-07-06 14:23 6443个人技术博客:http://demi-panda.com ... -
URL encode
2011-06-22 15:00 3058个人技术博客:http://demi-panda.co ... -
笔记之三-robots
2011-06-16 16:13 1104一、robots robots主要作用是屏蔽一些不愿意让 ... -
HTTP协议头部与Keep-Alive模式详解
2011-06-16 15:55 17222个人技术博客:http://demi-panda.com ... -
java.net.SocketException: Too many open files解决方法
2011-03-24 15:34 1169Get current limit: ulimit - ...
相关推荐
支持从solr自己的环境中获取自定义词典(使用solr的ResourceLoader,只需要把字典文件放到对应索引的conf目录里) 增加一个定时更新类 在IK中不建议用smart分词,因为它并不怎么准,ansj的分词效果明显更好。 这是一...
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-4.x和最高版本solr-4.x的分词接口. 1。目前最高版本:jcseg-1.9.2。兼容最高版本lucene-4.x和最高版本solr-4.x 2...
课时08:ik分词器插件从mysql中定时获取扩展词停顿词 课时09:ik分词器扩展词和停顿词动态加载演示 课时10:ik分词器获取扩展词后的使用 课时11:创建产品表加上ik分词器,导入单个文档 课时12:实战es的java客户端 ...
搜索:solr集群(solrCloud),配合zookeeper搭建, 使用spring-data-solor 缓存:redis集群,使用spring-data-redis 图片存储:fastDFS集群 网页静态化:freemarker 单点登录:cas 权限管理:SpringSecurity, 跨域...
1.6.2 中文分词 ……………….. 18 1.6.3 使用 R进行朴素贝叶斯分类… 22 朴素贝 叶斯分类..... . .…......... 39 1.6.6 多机环境使用 Mahout 运行 朴素贝叶斯分类…..........…… 47 1.7 更多的思考...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
3、连接复用,因此在多线程获取连接时无需阻塞; 4、同步调用; 5、超时机制; 6、支持多种通信框架(Mina/Netty/Grizzly),支持多种序列化/反序列化(Java/Hessian/PB); 7、支持自定义通信协议,可完全替换...
6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...
6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...