全文检索方案:
1. Lucene
2. sphinx
3. Solr(基于Lucene)
4. CoreSeek(基于sphinx)
方案1.Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。在Java开发环境里Lucene是一个成熟的免费开放源代码工具。
想用Lucene的朋友可以参考下SourceForge上的开源项目WebLucene.
WebLucene工作流程如下:
将数据用脚本导出成XML格式;
将XML数据源导入LUCENE索引;
从WEB界面得到XML结果输出,并通过XSLT生成HTML页面
参考车东网站:http://www.chedong.com/tech/weblucene.html
方案2:Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。
Sphinx 单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。
参考:http://iamcaihuafeng.blog.sohu.com/160584457.html
方案3:Apache Solr是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。
方案4就不介绍了。
建议还是在前三种中选择一种,像Oschina采用的是Lucene。
官网:
1.Sphinx: http://sphinxsearch.com/
2.Lucene: http://lucene.apache.org/
3.Solr: http://lucene.apache.org/solr/
2.CoreSeek:http://www.coreseek.cn/news/14/52/
分享到:
相关推荐
在本文中,我们讨论了两种解决方案来实现中文全文检索在 MySQL 中。这些解决方案可以帮助开发者实现中文全文检索,提高搜索效率和准确性。但是,这些解决方案也存在一些缺点,例如,转换时间过长、检索词的长度有限...
接下来,文档着重讨论了全文检索的必要性和优势。全文检索不仅能够执行一般的查询操作,而且能够提供更丰富的文本搜索功能。文档中还提到,尽管Spark SQL已经能够支持SQL基准的TPC-DS测试,但目前它并不支持全文检索...
最后,结合公文处理系统的实际需求,讨论如何设计和实现基于Lucene的全文检索功能。 2. 全文检索与 LUCENE 2.1 全文检索与全文检索简介 全文检索是指在文档集合中,通过对文档内容的分析,建立索引,然后根据用户...
全文检索系统是一种高效的信息获取工具,尤其在现代企业中,面对海量的数据和信息,它的价值不言而喻。该系统的主要目标是提供快速、精准的搜索功能,使得用户能够在短时间内找到所需的信息。下面我们将详细讨论这个...
本文将基于提供的描述和部分内文,深入探讨几种可能的解决方案及其优劣,并最终提出一种更加轻量级且高效的检索方案。 #### 常见潜在解决方案分析 1. **数据库搜索法** - **具体方法**:将标题数据存放在数据库...
关键词方面,医院信息系统、电子病历索引结构、全文检索等,都与本文所讨论的技术内容密切相关。电子病历全文检索系统的实现,对医疗、预防、教学、科研等各个医疗领域均具有重要意义,既能够提高医疗效率,也能在...
最后,通过本实现方法,可为不依赖昂贵全文检索引擎的中小型网站提供一种既经济又高效的中文全文检索方案。同时,也指出了全文检索功能的局限性和可能的优化方向,为后续的开发和优化提供了思路。
尽管有全文检索引擎这个现成的解决方案,但在资金有限的情况下,通过编程技巧和对数据库函数的深入理解,仍能实现高效且成本相对低廉的中文全文检索功能。这需要开发者具备扎实的数据库管理知识、编程技能以及对检索...
2. **Coreseek全文检索引擎**:Coreseek是一个开源的全文检索解决方案,它基于Sphinx搜索引擎,具有高速度和易于扩展的特点。它通常用于构建高性能的全文检索系统。 3. **Python**:Python是一种广泛使用的高级编程...
- **数字图书馆的全文检索**: 董慧等人给出了数字图书馆的全文检索方案,是对Lucene的二次开发成果。 - **基于Lucene的应用实例**: 郎小伟等人分析了Lucene结构,并给出了简单应用实例。 #### 三、Lucene的局限性和...
3. **信息检索 第9讲 检索排序.ppt**:此部分深入讨论了信息检索系统中的排序算法,包括相关性排序和用户反馈机制。可能会介绍TF-IDF、BM25等经典的检索排名模型,以及如何通过点击数据优化排序策略。 4. **信息...
8. **应用场景**:论文可能还会讨论图像检索技术在实际应用中的挑战和解决方案,如社交媒体图像搜索、监控视频分析、电子商务产品推荐等。 综上所述,这个压缩包中的论文将为我们提供一个深入了解图像检索技术的...
1. **语义表示**:讨论如何构建图像的语义表示,包括词嵌入(Word Embedding)、视觉词汇表(Visual Vocabulary)和深度学习模型如卷积神经网络(CNN)在提取语义特征上的应用。 2. **语义理解**:介绍如何利用机器...
标题中的“光速检索之检索本地文件”暗示了我们讨论的核心技术是关于高效搜索本地文件的解决方案,而“光速搜索Beta 1.0”则是实现这一目标的具体软件产品。这款由盛大创新院推出的工具旨在替代Windows内置的搜索...
此外,还会讨论检索效果的评估指标,如查全率、查准率、召回率和F值,这些都是衡量信息检索系统性能的重要标准。 为了提升实践能力,实验指导书中会包含一系列实际操作环节,比如搭建简易的信息检索系统,设计并...
下面我们将深入讨论该平台涉及的关键技术、设计原则以及实现步骤。 首先,我们要理解多媒体信息检索的核心在于数据的预处理和特征提取。对于图像数据,这可能包括色彩直方图、边缘检测、纹理分析等特征;对于音频,...
5. **基于内容和基于文本图像检索的结合**:讨论如何综合两种方法的优点来改进检索结果。 6. **相关反馈**:介绍如何利用用户反馈来改善检索算法。 7. **图像检索评估**:解释如何评价图像检索系统的性能。 8. **...
全文检索功能使得用户在遇到具体问题时,能够迅速找到对应的解决方案,无论是对专业设计师、工程师还是物业管理者,都是一份极其实用的参考资料。通过对这份文档的深入学习,读者可以全面掌握建筑给水排水及采暖工程...
图像检索系统是计算机视觉领域的...它不仅关注色彩,还考虑了图像的结构信息,从而提供了一种全面的图像相似性比较方案。这样的系统在诸如数字图书馆、监控视频分析、社交媒体图片搜索等多个领域都有广泛的应用前景。