最新文章列表

(转)关于lucene2.0的创建、检索和删除功能的完整实现

    最近要做一个站内的全文检索功能,主要是针对clob字段的,于是去网上找了点lucene的资料,现在新版本的是2.0.0,网上的例子多是1.4.3的,有些方法已经废弃了,搞了n久终于把2.0.0的功能实现了,呵呵,下面把实现的代码贴出来,实现了索引的创建、检索和删除功能,并可以从检索结果去查询数据库~ // 创建索引     public void indexFiles() {       ...
liangcmwn 评论(0) 有1344人浏览 2007-04-30 17:58

关于lucene

lucene不是一个完整的全文检索应用,它是用JAVA写的全文检索的工具包。lucene包包括:org.apache.lucene.document这个包提供了一些为封装要索引的文档所需要的类,比如 Document, Field。这样,每一个文档最终被封装成了一个 Document 对象。org.apache.lucene.analysis这个包主要功能是对文档进行分词,因为文档在建立索引之前必须 ...
lisanping 评论(0) 有1092人浏览 2007-04-27 01:55

Lucene索引原理

Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下:      0)设有两篇文章1和2   文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too.   文章2的内容为:He once lived in Shanghai.      1)由于lucene是基于关键词索引和查询的,首先我们要取得 ...
wind_bell 评论(4) 有4660人浏览 2007-04-25 17:20

深入 Lucene 索引机制

Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。 在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是, ...
wind_bell 评论(0) 有1490人浏览 2007-04-24 18:13

五一去上海找工作,希望各位可以给点建议

我5月上旬会一直呆在上海 希望可以有面试的机会 但是由于这边的离职手续还没办妥,所以最快也要7月中旬才能入职. 不知道这样的情况会不会有公司愿意在5月份就面试我 紧张啊 我还从来没参加过正规的面试呢 现在的工作是因为在大学实习的时候,表现出色,被直接录用的 我觉得我这个人是比较不擅长面试和笔试,但是擅长解决问题的类型. 心情比较忐忑啊 呵呵
fins 评论(16) 有5798人浏览 2007-04-23 19:11

Lucene学习笔记(3)

  继续学习车东利用Lucene提供网站全文检索的开源项目。   由于文档不全,这次看代码看得很苦,几乎是用log4j一个类一个方法的看过来的。令人高兴的是,期间请教车东时,他说到要重新整理一下整个项目的源代码和文档,估计后来者可以轻松矣。   除了以前提到的汉化外,车东在这个项目中,加入了很多实用的东东,如反显、排序、摘要等,甚至也连网页过期时间、输出格式的限制都考虑到了。   下面是我的测试 ...
junjie314 评论(0) 有1010人浏览 2007-04-23 13:20

Lucene学习一

最近要用到全文检索技术。 这个Lucene是个在java界有着很高声誉的全文检索包。 通过学习,自己对它算是有个初步了解。所以写下心得与经验跟朋友们分享。 对于整个网站的结构我说下我的看法 数据库+前端技术+后台处理技术。 上面的这些我就不说了。用来用去就是那几个,你觉得那个用的顺手就行了。 搜索引擎技术呢,我觉得要点是: 1。把我们分散的数据资源整合起来-----对应于Lucene的Index也 ...
wuhua 评论(12) 有4631人浏览 2007-04-16 16:24

javascript小技巧

事件源对象  event.srcElement.tagName  event.srcElement.type  捕获释放  event.srcElement.setCapture();   event.srcElement.releaseCapture();   事件按键  event.keyCode  event.shiftKey  event.altKey  event.ctrlKey  事件返 ...
zhangljerry 评论(0) 有1114人浏览 2007-04-12 16:53

lucene2.0中的查询疑问

环境:lucene2.0 我通过lucene把数据库中需要全文检索的表都建立了索引 其中包括: id:主键 title:标题 content:描述 keywords:关键字 bigClass:大类 smailClass:小类 city: 城市 需求: 现在客户从客户端输入一个关键字k,那么,可以在title/content/keywords里面匹配,关系是or,就是说有一个满足就行了 b ...
yxhzj 评论(1) 有1347人浏览 2007-04-09 20:47

网站之MySQL 索引分析和优化

源自  http://www.eol.cn 一、什么是索引?   索引用来快速地寻找那些具有特定值的记录,所有MySQL索引都以B-树的形式保 存。如果没有索引,执行查询时 ...
java998 评论(0) 有1108人浏览 2007-03-25 11:27

lucene之分词,索引,存储

全文检索(lucene): 刚接触lucene时,对分词,索引,存储不是很了解,经过深入的学习,逐渐连接了这三个的概念; 1,分词:就是剔除掉常见到词(当然这里可以自定义那些要被剔掉的词),如"我是java程序员,我用eclipse开发java",一般 人搜索不会输入"我","用","开发"这些词,我们把它们剔除掉,就剩 ...
weishuwei 评论(0) 有3765人浏览 2007-03-21 14:57

关于Ajax入门文章查找看JavaEye

     最近一个项目要用到ajax,我在这个论坛使用的时间也有段日子了。觉得里面的帖子质量是不错。 但今天用起来发现,javaeye的发展瓶颈是,多数文章只是分割的。不能成一体,只是对莫方面,莫个点进行阐述,引起大家的共同思考。我想我们大家不仅仅要思考,还是要做项目的,各种项目都会大量的引用网络现有的资源。     比如我今天就想找些完整的ajax应用,或者是入门的应用也,发现在javaeye是找 ...
wuhua 评论(4) 有3076人浏览 2007-03-14 14:14

元搜索引擎的研究和设计

元搜索引擎的研究和设计 计算技术研究所 李锐 colin719@126.com 摘要:论文简要介绍了元搜索引擎的相关知识,提出了一个元搜索引擎系统的设计构想。该系统采用了反馈机制,在用户察看结果时进行在线学习和调整。在系统设计中提出了搜索语法的设计、基于用户喜好的成员搜索引擎的自动调度机制、个性化服务的支持等,并给出了建立一个元搜索引擎系统的关键技术。最后分析了该系统的意义以及尚需解决的问题。 ...
tianping 评论(0) 有928人浏览 2007-03-13 14:43

自己写的一个基于词库的lucene分词程序--ThesaurusAnalyzer

       前一段时间用lucene做一个搜索程序,找了好长时间的中文分词程序,都没找到合适的,最后自己弄了一个.现在共享出来.希望对大家有用.       ...
jolestar 评论(19) 有16997人浏览 2007-03-10 02:22

基于Java的全文索引/检索引擎——Lucene 转

http://www.chedong.com/tech/lucene.html
hunteagle 评论(0) 有975人浏览 2007-03-02 12:28

lucene搜索和权限怎么结合呢?

现有一已有的CMS系统,希望在原来的关键词搜索基础上加上全文检索。 该CMS系统原有的权限设计是这样的:有一个cms_info表,我们假设其中最有用的是id,keywords,content 3个字段,字段见名知意,另外还有一个cms_acl表,其中最有用的字段是refid,visit 2个字段,refid是cms_info的id字段外键,visit是访问类型,具体解释一下visit:该CMS系统中 ...
apollo7733 评论(4) 有3483人浏览 2007-03-01 02:25

[zz]深入lucene索引机制

developerWorks 中国  >  Java technology | Open source  > 深入 Lucene 索引机制 ...
imjl 评论(1) 有3629人浏览 2007-02-21 11:43

linux下安装BugZilla

linux下安装BugZillaBugzilla安装需要perl5.6.1及以上版本、mysql4.0.14及以上版本(PostgreSQL7.3.x及以上版本)1、下载bugzilla从 http://ftp.mozilla.org/pub/mozilla.org/webtools/bugzilla-2.20.4.tar.gz 下载bugzilla。(据说版本号中间的数字为偶数代表稳定版,为奇数代 ...
wiflish 评论(0) 有7758人浏览 2007-02-08 03:00

全文检索分词顺序

索引 1: 空格,,whitespaceTokenize 2: 过滤词,,,StopFilter 3: 拆字,,,,WordDelimiterFilter 4: 小写过滤 ,,,LowerCaseFilter 5: 英文相近词,,,EnglishPorterFilter 6: 去除重复词,,,RemoveDuplicatesTokenFilter 查询 1: 查询相近词 2: 过滤词 3: 拆字 ...
imjl 评论(1) 有4758人浏览 2007-01-31 12:18

oracle9i的全文检索技术

关键词 oracle text 全文检索  oracle一直致力于全文检索技术的研究,当oracle9i rlease2发布之时,oracle数据库的全文检索技术已经非常完美,oracle text使oracl ...
pharaohsprince 评论(0) 有891人浏览 2005-08-21 10:49

最近博客热门TAG

应用服务器(43289) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23314) Struts(22805) Bean(22194) 企业应用(18270) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics