`
itwangxinli
  • 浏览: 143845 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

使用Lucene对文章进行全文检索

阅读更多
最近公司开发一个出版局的藏品管理系统,因为设计,需要使用Lucene对XML文档的节点进行全文检索。借此机会也对Apach的Lucene 研究了一下,觉得Lucene真的很不错,系统设计的很巧妙,特别是它的数据结构设计的很巧,数度很快。 也许你想从一堆文档中查找某个关键字,但是面对如此字多的文档,你该怎么办呢,写个程序,依次读取里面的内容和要查找的关键字进行匹配?现在有更好的开源工具Lucene,只需要对文档进行建立索引,你就可以对文档进行Query了,而且还可以进行更精确的查找。详细资料请到apach的网站上进行查找。Lucene  In action 可以作为详细参考资料。
分享到:
评论

相关推荐

    Lucene全文检索引擎简介

    建立一个高效检索系统的关键是建立一个类似于科技索引一样的反向索引机制,将数据源(比如多篇文章)排序顺序存储的同时,有另外一个排好序的关键词列表,用于存储关键词==>文章映射关系,利用这样的映射关系索引:...

    博客园文章搜索项目(Lucene)

    对学习lucene开发的人员来说这个项目非常有价值 值得参考">项目的页面都存在WebRoot WEB INF jsp下 网上搜索博客园网页的地址 输入到相应搜索框 该项目可以自动对博客园网站中的文章 项目中限制了文章数量 建立...

    基于Lucene_XML全文检索的应用及效率测试研究

    Lucene是建立自己的搜索引擎所必需的。本文章基于Lucene_XML全文检索的应用,并且进行了效率测试研究。不妨下载一看。

    Apache Lucene全文检索和IKAnalyzer分词工具类

    * Apache Lucene全文检索和IKAnalyzer分词工具类 * <p>Company: 91注册码 * time:2014-04-22 * @author www.91zcm.com * @date * @version 1.1 */ public class LuceneUtil { /**索引创建的路径**/ ...

    Lucene3.1使用教程

    主要是做站内搜索,即对一个系统内的资源进行搜索。如BBS、BLOG中的文章搜索,网上商店中的商品搜索等

    基于Lucene的搜索引擎的实现

    完整代码,基于Lucene的分词,根据搜索引擎的目标和基本内容,将实现功能模块主要划分为创建中文分析器(创建索引)、读取索引文件查询记录、根据输入的内容进行分词、根据关键字进行全文检索、将结果按JSON格式输出...

    汤阳光_Lucene3.0课程

    我们使用Lucene,主要是做站内搜索,即对一个系统内的资源进行搜索。如BBS、BLOG中的文章搜索,网上商店中的商品搜索等。使用Lucene的项目[In addition to those organizations mentioned on the Powered by Lucene ...

    关于全文检索的文章(使用技术Lucene3.0)

    NULL 博文链接:https://devsky.iteye.com/blog/1038756

    搜索引擎的搭建(Lucene)代码

    搜索引擎的搭建(Lucene)文章对应的代码。详细介绍https://blog.csdn.net/yyhui95/article/details/72526193

    用lucene实现摘要的高亮点

    类主要是符合本人项目的需求,内容摘要的高...注意一点的是在对内容进行高亮度化的过程中,其实也就是进行全文检索的过程,所以对文本内容进行分词是必不可少的。否则将无法找到文本中对应的关键词。详细请看类的实现

    HubbleDotNet 全文检索

    HubbleDotNet 是一个基于.net framework 的开源免费的全文搜索数据库组件。开源协议是 Apache 2.0。HubbleDotNet 提供 ...该文章是本人从博客园eaglet发表的文章中整合下来的,希望对广大热爱全文检索的朋友有帮助!

    Lucene的使用与优化

    Analyzer是分析器,它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语,这里说的无效词语是指英文中的“of”、“the”,中文中的“的”、“地”等词语,这些词语在文章中大量出现,但是本身...

    Lucene 3.0 原理与代码分析

    本系列文章将详细描述几乎最新版本的Lucene的基本原理和...Lucene学习总结之一:全文检索的基本原理 http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html Lucene学习总结之二:Lucene的总体架构 ...

    智周个人知识库--全文检索及标注系统 WiseFtsMark_v1.30

    智周个人知识库--全文检索及标注系统 这是一个利用 lucene.net 技术开发的程序。用于查询个人计算机中的文件信息,包含了全文检索及标注系统。 随着计算机中文件的累积,常会有查找不易的问题。 解决方法1:”...

    全文检索技术学习(三)——Lucene支持中文分词 - 李阿昀的博客 - CSDN博客1

    全文检索技术学习(三)——Lucene支持中文分词 - 李阿昀的博客 - CSDN博客首页博客学院下载图文课论坛问答商城活动招聘搜博主文章写博客小程序全文检索技

    lucene-sequence-diagram:lucene搜索端uml时序图,lucene源码解析

    query就是查询参数,weight即对查询参数赋予权重,比如查询title包含"lucene"的文章,则首先对"lucene"这个term赋予权重 1.1 对"lucene"这个term赋予权重,需要先从索引文件中读取"title"这个字段的倒排表信息,即图中

    基于LUCENE的藏文全文检索的研究 (2009年)

    由于目前基于 LUCENE的中文全文检索正在适应中文信息技术发展的需求等方面进行探索,基于 LUCENE的藏文全文检索也需要适应藏文信息技术发展的需求进行新的探索。文章介绍了一种全文检索引擎工具包——LUCENE,并结合...

    基于java+Lucene+Tomcat的搜索引擎设计与实现(源码+文档)JAVA_Lucene_Tomcat_搜索引擎.zip

    资源名字:基于java+Lucene+Tomcat的搜索引擎设计与实现(源码+文档)JAVA_Lucene_Tomcat_搜索引擎.zip 资源类型:项目全套源码+文档+辅导视频 源码说明: 全部项目源码都是经过测试校正后百分百成功运行。 适合场景...

    lucene-wikipedia:基于Lucene的多句上下文检索器,用于开放域质量检查设置

    Lucene多句子上下文检索器这个基于Lucene的QA数据集索引可在查询条件下检索多句子上下文。 它是我们开放域质量检查管道中的主要组件,充当相关文本的检索器,供读者处理和输出相应查询的答案。索引编制对于每个数据...

    基于ASP.Net和Lucene.Net开发的站内搜索引擎Demo源码+项目说明+sln解决方案.zip

    基于ASP.Net和Lucene.Net开发的站内搜索引擎Demo源码+项目说明+sln解决方案.zip 1)EDC.SearchEngine.Dao  顾名思义,数据访问层,与数据库进行交互,各种SQL! (2)EDC.SearchEngine.Service  业务逻辑层,对...

Global site tag (gtag.js) - Google Analytics