Solr 获取分词

a280606790

浏览: 473507 次
性别:
来自: 湖南

最近访客更多访客>>

paganini0102

Hello---World

yezhi3514

hellodota

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr
j2ee
lucene

个人博客：http://demi-panda.com

Solr 1.4 有了对字段的分词。FieldAnalysisRequestHandler 可以对某个字段或字段类型的分词器对查询串取到分词数据。

用 solr 的默认配置，如 solr 1.4.0。

我用 mmseg4j 为例。在 solr.root/example/solr/conf/schema.xml 的 types 元素内加：

<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"/>
</analyzer>
</fieldType>

把 IKAnalyzer -3.2.8.jar 放到 solr.home/example/solr/lib，没有 lib 目录，创建一个。更多关于 solr 中使用 mmseg4j 的内容请看：solr 中文分词 IKAnalyzer 使用例子。

如：“北京烤鸭 ”
http://localhost:6091/solr-web-shop/shop/analysis/field?q=北京烤鸭&analysis.fieldtype=text&indent=on&wt=json

{

responseHeader : {
- status : 0 ,
- QTime : 3
},
analysis : {
- field_types : {
  
  text : {
  
  query : [
  
  "org.wltea.analyzer.lucene.IKTokenizer" ,
  
  [
  
  {
  
  text : "北京烤鸭" ,
  
  start : 0 ,
  
  end : 4 ,
  
  position : 1 ,
  
  positionHistory : [
  
  1
  
  ],
  
  type : "word"
  
  },
  
  {
  
  text : "北京烤" ,
  
  start : 0 ,
  
  end : 3 ,
  
  position : 2 ,
  
  positionHistory : [
  
  2
  
  ],
  
  type : "word"
  
  },
  
  {
  
  text : "北京" ,
  
  start : 0 ,
  
  end : 2 ,
  
  position : 3 ,
  
  positionHistory : [
  
  3
  
  ],
  
  type : "word"
  
  },
  
  {
  
  text : "烤鸭" ,
  
  start : 2 ,
  
  end : 4 ,
  
  position : 4 ,
  
  positionHistory : [
  
  4
  
  ],
  
  type : "word"
  
  }
  
  ],
  
  "org.apache.lucene.analysis.synonym.SynonymFilter" ,
  
  [],
  
  "org.apache.lucene.analysis.StopFilter" ,
  
  [],
  
  "org.apache.lucene.analysis.LowerCaseFilter" ,
  
  [],
  
  "org.apache.solr.analysis.RemoveDuplicatesTokenFilter" ,
  
  []
  
  ]
  
  }
  
  },
- field_names : { }
}

}

代码实现：

public static void main(String[] args) throws MalformedURLException, SolrServerException, IOException {
    CommonsHttpSolrServer solrServer = new CommonsHttpSolrServer("http://localhost:6091/solr-web-shop/shop");
    
    FieldAnalysisRequest request = new FieldAnalysisRequest("/analysis/field");
    request.addFieldName("shopName");
    request.setFieldValue("text");
    request.setQuery("北京烤鸭");
    FieldAnalysisResponse response = request.process(solrServer);
    System.out.println(response.toString());
    Iterator it = response.getFieldNameAnalysis("shopName").getQueryPhases().iterator();
    while(it.hasNext()) {
      AnalysisPhase pharse = (AnalysisPhase)it.next();
      List<TokenInfo> list = pharse.getTokens();
      for (TokenInfo info : list) {
        
      System.out.println(" text : "+ info.getText());
      }
      
    }
  }

分享到：

Linux Deepin 安装永中 Office2012 个人版 ... | Apache Lucene 和 Solr 进行位置感知搜索

2012-05-07 18:32
浏览 3528
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Solr 获取分词

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Solr 获取分词

评论

发表评论

相关推荐

Maven使用deploy命令部署构建

Java 对象序列化您不知道的 5 件事

对Lucene PhraseQuery的slop的理解

Apache Lucene 和 Solr 进行位置感知搜索

Lucene Similarity (Lucene 文档评分score机制详解)

地图经纬度距离计算

ThreadLocal类

Solr Replication

Solr 同义词搜索 synonyms

解决 – java.lang.OutOfMemoryError： unable to create new native thread

Spring MVC中默认的ResponseBody为String的乱码问题

Solr合并索引方式

Solr Faceted

SolrOperationsTools使用

ASCII和中文互转

JVM 参数详解

URL encode

笔记之三-robots

HTTP协议头部与Keep-Alive模式详解

java.net.SocketException: Too many open files解决方法

最近访客更多访客>>