最新文章列表

如何将Lucene索引写入Hadoop2.x?

转载请务必注明,原创地址,谢谢配合! http://qindongliang1922.iteye.com/blog/2090121 散仙,在上篇文章,已经写了如何将Lucene索引写入Hadoop1.x的HDFS系统,本篇散仙将介绍上将索引写在Hadoop2.x的HDFS上,写入2.x的Hadoop相对1.x的Hadoop来说要简单的说了,因为默认solr(4.4之后的版本)里面自带的HDFSD ...
qindongliang1922 评论(4) 有3196人浏览 2014-07-09 20:22

如何将Lucene索引写入Hadoop?

转载请务必注明,原创地址,谢谢配合! http://qindongliang1922.iteye.com/blog/2088076 Hadoop是Lucene的子项目,现在发展如火如荼,如何利用Hadoop的分布式处理能力,来给Lucene提高建索引的效率呢,如此一来,便能充分利用HDFS的所有优点,但众所周知,HDFS系统,对随机读支持的并不友好,而像Lucene这种全文检索的框架,几乎所有的 ...
qindongliang1922 评论(2) 有3810人浏览 2014-07-03 19:16

如何使用solr的join

对于用惯数据库的我们,多表进行join连接,是非常常见的一个需求,但是在我们的索引中,对join的支持,却不是很完美,当然这并不是由于我们的Lucene或Solr不够强大,而是全文检索与数据库的定位不是在同一个目标上,全文检索,主要定位在搜索引擎上,通常是对一个大的索引进行高效检索,而数据库则是定位在结构化数据的存储于与检索,检索功能比较薄弱,那我们的索引是不是就不支持join了,实事并非如此,Lu ...
qindongliang1922 评论(0) 有3999人浏览 2014-05-14 21:53

处理上百万条的数据库如何提高处理查询速度

1、对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2、应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:   select id from t where num is null   可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:   select ...
hehaisu 评论(0) 有900人浏览 2014-02-12 16:03

Sphinx介绍

Sphinx介绍   Sphinx是由一个开源的全文检索引擎,功能类似Lucune,用C++编写,可为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx ...
qindongliang1922 评论(0) 有1868人浏览 2014-02-07 10:56

lucene 之 全文检索概述

我们日常生活中的数据可以分成两种,一种是结构化数据,还有一种是非结构化数据。 结构化数据就是固定格式和有限长度的数据,比如数据库和元数据等等。 非结构化就是无固定格式和不定长的数据,比如邮件和word文档。 还有介于两者之间的,半结构化数据,比如XML,html等,看具体需求可以有不同的处理方法。 非结构化数据还可以叫做全文数据。搜索引擎一般是针对这种数据来索引。 一种最直观的方法可以 ...
sharp-fcc 评论(0) 有543人浏览 2014-02-05 16:22

Lucene4.3进阶开发之礼敬如来(十三)

转载请务必注明,原创地址,谢谢配合! http://qindongliang1922.iteye.com/blog/2008396 散仙,在前几篇文章介绍了lucene的几种索引格式的文件以及存储的结构,那么本篇,散仙就来浅谈下lucene中的评分机制。 评分功能,在全文检索中也算是一个非常重要的模块,因为评分的好坏,直接决定着用户搜索匹配的相关性,试想一下假如用户输入了一个搜索词,搜索 ...
qindongliang1922 评论(0) 有3831人浏览 2014-01-23 00:40

lucene学习

lucenen学习 topic/1132879
jccjtt18z 评论(0) 有464人浏览 2013-12-24 11:37

必须掌握的全文检索框架Lucene,带你一周从入门到精通Lucene!

专辑:Lucene (全文检索工具)从入门到精通 简介:Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检 ...
lk557 评论(0) 有2361人浏览 2013-12-19 10:01

nutch 01 认识nutch

1.1 什么是nutch nutch 就一个开源的java 实现的搜索引擎,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和web爬虫。现在的nutch 的发展趋势是网络爬虫,全文搜索是用lucene的内核,nutch 是lucene的一个子项目,apache 又从nutch项目里面产生了hadoop,tika,gora等其他子项目,其实就是对一些公共模块的封装,重用,然后起个名字,实 ...
zhangzhanlei1988 评论(1) 有1311人浏览 2013-10-27 18:46

oracle 全文检索实践

前段时间,项目组长让我看一下有没有实时检索数据的方案,并说明不是用数据库模糊查询关键字like,而是像baidu那样的搜索效果,做到最大匹配。并提 ...
weizichong 评论(0) 有1004人浏览 2013-10-26 11:18

mysql全文检索

mysql到版本3.23.23时,开始支持全文检索,通过语句SELECT ... FROM ... MATCH(...) AGAINST(...) 来在整个表中检索是否有匹配的,全文索引是一个定义为fulltext的类型索引,应用在myisam表中。值得一提的是对于一个大的数据库来说,把数据装载到一个没有fulltext索引的表中,然后再添加索引,这样速度会非常快,但是把数据装载到一个已经有full ...
zqh1986 评论(0) 有642人浏览 2013-09-04 09:07

基于Spring的Hibernate Search全文检索效能示例

基于Spring的Hibernate Search全文检索功能示例 http://hi.baidu.com/zwnlavmytfbjnwd/item/e98bfc516cd72cced3e10c41 Hibernate Search牛刀小试http://blog.csdn.net/yanghuw/article/details/180801 ...
Appleses 评论(0) 有2343人浏览 2013-08-21 17:35

Lucene4.3开发之第五步之融丹筑基(五)

  本文章允许转载,转载请注明原创地址 http://qindongliang1922.iteye.com/blog/1924608 排序是对于全文检索来言是一个必不可少的功能,在实际运用中,排序功能能在某些时候给我们带来很大的方便,比如在淘宝,京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品,或者通过排序来找到评论数最高或卖的最好的商品,再比如在Iteye里的博客栏里,每天都会以 ...
qindongliang1922 评论(0) 有8504人浏览 2013-08-14 17:57

最全的ASP.NET开源CMS汇总

摘要:汇总了一些asp.net开源cms,希望对学习ASP.NET的人员带来帮助.   国内: 1.SiteServer CMS SiteServer CMS 网站内容管理系统(著作权登记号2008SR15710)是定 ...
czykeith 评论(0) 有696人浏览 2013-08-12 10:33

Lucene4.3开发之第三步之温故知新(三)

前面几篇笔者已经把Lucene的最基本的入门,介绍完了,本篇就对Lucene基本的知识做一个总结,以便于加深对Lucene基本API组件的理解。 为了方便对比学习,下面给出表格数据 索引期间使用的API组件检索期间使用的API组件IndexWriterIndexReaderIndexWriterConfigIndexSearcherDirectoryDirectoryAnalyzerQueryP ...
qindongliang1922 评论(1) 有4981人浏览 2013-08-07 18:30

Lucene4.3开发之第二步初入修真(二)

上次笔者简单介绍下了,Lucene的入门搭建以及一个添加的Demo,这次写了一个包含增删改查比较完整的例子,以供各位入门新手的道友们参考,当然这个只是最简单的封装,有很多参数都是写死的 ,所以有点不灵活,各位朋友也可以自己试着参考笔者的Demo封装一个比较通用的例子,在实际的项目环境中,封装一定要做到既通用又灵活,这个看各位的业务的需求了,不同的业务需求可能不一样。 在入门,搭建好最基本的环境之 ...
qindongliang1922 评论(5) 有7970人浏览 2013-07-29 18:23

Lucene4.3开发之第一步小试牛刀(一)

首页,本篇适合对于刚学lucene的朋友们,在这之前笔者还是喜欢啰嗦几句,想要学好一门技术,首先就得从思想层次上全面了解这种技术的作用,适用范 ...
qindongliang1922 评论(0) 有8238人浏览 2013-07-25 16:47

lucene开发序幕曲之luke神器

lucene是一款很优秀的全文检索的开源库,目前最新的版本是lucene4.4,关于lucene的历史背景以及发展状况,在这里笔者就不多介绍了,如果你真心想学习lucen ...
qindongliang1922 评论(39) 有8330人浏览 2013-07-25 11:28

使用solr搭建你的全文检索

使用solr搭建你的全文检索 Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档: 实战Lucene,第 1 部分: 初识 Lucene:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/ 用Lucene加速Web搜索应用程序的开发:http://www.ibm.c ...
zpball 评论(0) 有1382人浏览 2013-07-11 13:54

最近博客热门TAG

应用服务器(43289) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23314) Struts(22805) Bean(22194) 企业应用(18270) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics