`

lucence hello world

    博客分类:
  • java
阅读更多
/*
	 * lucence version 3.0.3
	 * 全文检索
	 * 
	 * 倒排索引:单词指向文档。以关键词和分词为单位,先读取文档内容,拆分关键词,关键词定位。
	 * 因为词语的数量是有限的,所以索引量不会随着文本内容的增长也线性增长。
	 * 
	 * 引入lucence jar包
	 */
	public static void main(String[] args) throws Exception {
		//A创建索引
		//简单例子,创建索引保存在内存中
		Directory dir = new RAMDirectory();
		//分词器使用lucence标准的,参数Version指定使用的lucence版本
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
		/*
		 * IndexWriter 创建和维护索引
		 * param1 
		 * param2 指定创建索引使用的分词器
		 * param3 是否覆盖已有索引
		 * param4 最大Field长度
		 * 
		 */
		IndexWriter writer = new IndexWriter(
				dir,analyzer,true,IndexWriter.MaxFieldLength.UNLIMITED);
		//添加索引
		String[] docs ={
				"hello java",
				"search aha java",
				"friday hello"
		};
		/*
		 * Document是Field的容器,被搜索的单元,搜索结果是已doc的形式返回
		 * 每个Field拥有Key,Value
		 */
		for(int i = 0;i<docs.length;i++){
			Document d = new Document();
			d.add(new Field("name" //key
							,docs[i]//value
							,Store.YES//是否存储在索引中
							,Index.ANALYZED//该Field是否被索引
			));
			writer.addDocument(d);//将doc交给writer处理
		}
		writer.close();
		
		
		//B 搜索
		//创建搜索对象
		//参数是索引目录,指定为上面创建的索引
		Searcher searcher = new IndexSearcher(dir);
		QueryParser parser = new QueryParser(
							Version.LUCENE_30 //指定版本
							,"name" //默认搜索的Feild(key)
							,analyzer//搜索用的分词器,和上面创建索引使用一样的
							);
		Query query = parser.parse("hello"/*需要解析搜索的关键词*/);
		//搜索,取结果的前5条
		ScoreDoc[] tds = searcher.search(query,5).scoreDocs;
		System.out.println(tds.length);//符合结果doc数
		for(int i=0;i<tds.length;i++){
			Document doc = searcher.doc(tds[i].doc);
			//打印doc中key是name的Field的value
			System.out.println(doc.get("name"));
		}
		/*输出结果
		 * 	2
			hello java
			friday hello
		 */
	}
1
4
分享到:
评论

相关推荐

    Lucene之Helloworld

    NULL 博文链接:https://okwangxing.iteye.com/blog/602303

    lucene:lucene构建索引,从HelloWorld到项目具体使用

    lucene构建索引,从HelloWorld到项目具体使用 ====================项目一:=================================== qianjun.lucene.first ====================项目二:=================================== qianjun....

    lucene-入门

    概述 Lucene简介 Lucene架构原理 Lucene应用示例(Hello World)

    Lucene演示

    Lucene代码演示,Helloworld,简单演示

    Struts Web设计与开发大全

    17章:Hello World类和Ant脚本及基本Web应用结构和Ant脚; 18章:Hello World类和测试类以及Struts测试工程; 19章:Struts与Hibernate结合应用; 20章:lucene1全文检索应用,直接复制到tomcat的webapps目录下...

    基于SSM框架构建积分系统和基本商品检索系统源码.zip

    【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用!...#### (三)[ Redis系列(一)--安装、helloworld以及读懂配置文件](http://blog.csdn.net/jack__frost/article/details/67633975

    涵盖了90%以上的面试题

    如何在main方法执行前输出”hello world” java程序的初始化顺序 请说出作用域public,private,protected,以及不写时的区别 为什么java中有些接口没有任何方法 java中的clone方法有什么作用 面向对象有哪些特征 ...

    JAVA上百实例源码以及开源项目

     Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...

    JAVA上百实例源码以及开源项目源代码

     Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...

Global site tag (gtag.js) - Google Analytics