`
java0
  • 浏览: 9688 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
最近访客 更多访客>>
社区版块
存档分类
最新评论

Lucene的Field类型

阅读更多
1.       2.0以前的版本
  • Keyword: Field的值将被保存到索引文件,为Field的值建立索引,建立索引时不需要分词。
  • UnIndexed: Field的值将被保存到索引文件,不为Field的值建立索引,因此不能通过该Field搜索文档。
  • UnStored: Field的值不被保存到索引文件,将Field的值分词后建立索引
  • Text: Field的值分词后建立索引。如果参数为String值将被保存,为Reader值不被保存
2.       2.0版本
    用几个内部类的组合来区分Field的具体类型。
  • Store
        COMPRESS:压缩保存。用于长文本或二进制数据
        YES:保存
        NO:不保存
  • Index
        NO:不建索引
        TOKENIZED:分词,建索引
        UN_TOKENIZED:不分词,建索引
        NO_NORMS:不分词,建索引。但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
  • TermVector
        NO不保存term vectors
        YES保存term vectors。
        WITH_POSITIONS保存term vectors。(保存值和token位置信息)
        WITH_OFFSETS保存term vectors。(保存值和Token的offset)WITH_POSITIONS_OFFSETS:保存term vectors。(保存值和token位置信息和Token的offset)
分享到:
评论

相关推荐

    Apache Lucene全文检索和IKAnalyzer分词工具类

    import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.Term; import org.apache.lucene.queryParser.MultiFieldQueryParser; import org.apache....

    Lucene笔记.doc

    Lucene笔记中包含了 什么是lucene 应用领域 创建索引 使用luke查看索引 搜索索引 Field域的详细介绍 各种类型的搜索 使用中文分词器

    基于lucene的搜索引擎总结

    TermQuery:最基本的查询类型,用来匹配特定Field中包含特定值的文档 Hits:存放有序搜索结果指针的简单容器 全文索引/搜索 Lucene搜索代码示例: IndexSearcher searcher = new IndexSearcher(directory); Term t =...

    Lucene+in+Action简体中文版1-4章

    例如,如果这句话“For example, if this sentence were indexed into a field”被索引到一个域(Field)中(假设域类型为Field.Text),相应产生的项可能是以for和example两个单词打头,其它的项随之按照它在句子中...

    solr 企业搜索引擎教程

    Apache Lucene 实现。定制 Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一 个描述所有 Field 及其内容的 XML 文档就可以了。定制搜索的时候只需要发送 HTTP GET 请求 即可,然后对 Solr 返回的信息进行...

    solr6对应的IKAnalyzer分词器

    3. 添加一个中文分词的字段类型(filedType):在solr中,字段类型(fieldType)相当于数据库中的字段类型(`int`、`varchar`...),在`server/solr/RD-Product/conf/managed-schema`中配置如下内容 <!--中文分词器IK ...

    elasticsearch概述及应用.pdf

    Elasticsearch的核心概念主要包括索引(Index)、类型(Type)、文档(Document)和字段(Field)。索引是一个存储相关文档的容器,类似于关系型数据库中的数据库;类型类似于关系型数据库中的表,但在Elasticsearch...

    Solr全文搜索服务器-其他

    每个文档由一系列的Field构成,每个Field表示资源的一个属性Solr中的每个Document需要有能唯一标识其自身的属性,默认情况下这个属性的名字是id,在Schema配置文件中使用:id进行描述。 Solr是一个高性能,采用Java...

    Elasticsearch 技术解析与实战.zip

    96 3.2.3 地理数据类型 100 3.2.4 专门数据类型 106 3.3 元字段 108 3.3.1 _all字段 109 3.3.2 _field_names字段 109 3.3.3 _id字段 110 3.3.4 _index字段 110 3.3.5 _meta字段 111 3.3.6 _parent字段 111 3.3.7 _...

    Java EE常用框架.xmind

    如果写在属性上可能会出现: Could not locate field nor getter method for property named Lucene 简介 Lucene是根据关健字来搜索的文本搜索工具(全文搜索引擎),只能在某个网站内部搜索文本...

    ZendFramework中文文档

    1. Introduction to Zend Framework 1.1. 概述 1.2. 安装 2. Zend_Acl 2.1. 简介 2.1.1. 关于资源(Resource) 2.1.2. 关于角色(Role) 2.1.3. 创建访问控制列表(ACL) ...2.1.5. 定义访问控制 ...

    Struts in Action中文版

    1. 介绍.........................................................................................................18 1.1. 关于本书..........................................................................

    struts in Action

    1. 介绍.........................................................................................................18 1.1. 关于本书...........................................................................

Global site tag (gtag.js) - Google Analytics