Lucene practice

aaron_ch

浏览: 180815 次
性别:
来自: 苏州

最近访客更多访客>>

wangtao731

roqingyou

lord_is_layuping

believems

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java

lucene Apache Java C C++

1.simply practice the lucene api for search document and data, post code first

lucene version :2.2.0

set up the index of files

java 代码

package com.aaron.lucene;
import java.io.File;
import java.io.FileReader;
import java.io.Reader;
import java.util.Date;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
/**
* This class demonstrate the process of creating index with Lucene for text
* files
*/
public class TxtFileIndexer {
public static void main(String[] args) throws Exception {
// indexDir is the directory that hosts Lucene's index files
File indexDir = new File("C:/bin/lucence/Index");
// dataDir is the directory that hosts the text files that to be indexed
File dataDir = new File("C:/bin/lucence/Data");
Analyzer luceneAnalyzer = new StandardAnalyzer();
File[] dataFiles = dataDir.listFiles();
IndexWriter indexWriter = new IndexWriter(indexDir, luceneAnalyzer,
true);
long startTime = new Date().getTime();
for (int i = 0; i < dataFiles.length; i++) {
if (dataFiles[i].isFile()
&& dataFiles[i].getName().endsWith(".txt")) {
System.out.println("Indexing file "
+ dataFiles[i].getCanonicalPath());
Document document = new Document();
Reader txtReader = new FileReader(dataFiles[i]);
document.add(new Field("path", dataFiles[i].getPath(),
Field.Store.YES, Field.Index.UN_TOKENIZED));
document.add(new Field("contents", txtReader));
indexWriter.addDocument(document);
}
}
indexWriter.optimize();
indexWriter.close();
long endTime = new Date().getTime();
System.out.println("It takes " + (endTime - startTime)
+ " milliseconds to create index for the files in directory "
+ dataDir.getPath());
}
}

Search key word

java 代码

package com.aaron.lucene;
import java.io.File;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.FSDirectory;
/**
* This class is used to demonstrate the
* process of searching on an existing
* Lucene index
*
*/
public class TextFileSearcher {
public static void main(String[] args) throws Exception {
String queryStr = "lucene";
//This is the directory that hosts the Lucene index
File indexDir = new File("C:/bin/lucence/Index");
FSDirectory directory = FSDirectory.getDirectory(indexDir);
IndexSearcher searcher = new IndexSearcher(directory);
if (!indexDir.exists()) {
System.out.println("The Lucene index is not exist");
return;
}
Term term = new Term("contents", queryStr.toLowerCase());
TermQuery luceneQuery = new TermQuery(term);
Hits hits = searcher.search(luceneQuery);
for (int i = 0; i < hits.length(); i++) {
Document document = hits.doc(i);
System.out.println("File: " + document.get("path"));
}
}
}

分享到：

Pear enhance PHP functionality: SQL2XML | PHP New Features

2007-09-19 22:23
浏览 1095
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop in Practice(2012): Hadoop in Practice collects 85 Hadoop examples and presents them in a problem/solution format. Each technique addresses a specific task you'll face, like querying big data using Pig or writing a log ...

Relevant.Search.With.applications.for.Solr.and.Elasticsearch: Using Elasticsearch, it teaches you how to return engaging search results to your users, helping you understand and leverage the internals of Lucene-based search engines. Purchase of the print book ...

【主流技术】ElasticSearch 在 Spring 项目中的实践.doc: 【Elasticsearch in Spring Project Practice】 Elasticsearch (ES) 是一个开源的、高度可扩展的分布式全文搜索引擎，以其近乎实时的数据存储、检索能力和出色的扩展性在企业级应用中广泛应用。它基于 Lucene 库...

Bet2.5e西门子S7-200模拟器：全面支持PPI与Modbus通讯，无PLC亦可测试，导入用户程序，无限制通讯模式: 内容概要：本文介绍了西门子S7-200模拟器bet2.5e版本的功能特点及其应用价值。该模拟器支持多种通讯协议如PPI和Modbus RTU，允许用户在没有真实PLC设备的情况下进行程序测试。它不仅能够模拟主站和从站的通讯，还可以便捷地导入用户程序并提供无限期使用的优势。尽管缺少网络通讯功能，但对于基础学习和简单项目的测试依然非常实用。适合人群：工控领域的初学者、工程师和技术爱好者，尤其是那些希望在没有真实PLC设备的情况下进行编程和通讯测试的人。使用场景及目标：适用于需要测试PLC程序和通讯协议的场景，帮助用户熟悉PLC编程和通讯机制，提高开发效率，减少硬件依赖。主要目标是在无硬件条件下完成程序调试和通讯测试。其他说明：文中详细展示了如何使用VB.NET、Python和梯形图语言进行具体的编程实例，强调了注意事项如地址映射、波特率设置等。此外，还提到了一些替代方法来弥补网络通讯功能的不足，如使用虚拟串口工具。

Cplex抽水蓄能容量优化配置程序：物超所值，清晰注释，可自由修改学习: 内容概要：本文介绍了一款用于抽水蓄能容量优化配置的CPLEX程序，旨在帮助用户通过数学规划方法实现抽水蓄能电站的最佳容量配置。程序不仅提供详细的代码示例，还包括视频讲解，使编程小白也能轻松理解。文中详细解释了容量优化的目标、配置参数的选择以及储能出力的重要性，并展示了如何通过CPLEX库构建线性规划模型，设定目标函数、添加约束条件并求解模型。此外，文章还讨论了实际应用场景中的注意事项，如充放电效率、水库容量变化、负荷跟踪约束等，并提供了修改参数进行场景分析的方法。适合人群：对抽水蓄能容量优化感兴趣的电力系统工程师、研究人员及编程爱好者。使用场景及目标：适用于需要进行抽水蓄能容量优化的工程项目，目标是通过合理的容量配置降低运营成本，提高系统稳定性。用户可以通过修改配置文件中的参数，如抽水效率、电价等，来进行不同的场景分析。其他说明：程序包内含实战讲解视频，有助于更好地理解和应用代码。代码中包含了多种实用技巧，如处理浮点数精度、时间序列数据等，这些都是实际项目中积累的经验。

Rust编译器诊断分级：Warning分类.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。 Rust 以内存安全、零成本抽象和并发高效的特性，重塑编程体验。无需垃圾回收，却能通过所有权与借用检查机制杜绝空指针、数据竞争等隐患。从底层系统开发到 Web 服务构建，从物联网设备到高性能区块链，它凭借出色的性能和可靠性，成为开发者的全能利器。拥抱 Rust，解锁高效、安全编程新境界！

3泵恒压供水PLC控制触摸屏系统设计：综合原理图、梯形图编程与组态展示: 内容概要：本文详细介绍了三泵恒压供水控制系统的硬件配置、PLC程序设计、触摸屏组态以及调试技巧。首先讨论了硬件配置的选择，包括变频器、压力传感器的安装位置及其重要性。接着深入探讨了PLC程序的核心逻辑，特别是PID压力调节和泵组轮换策略，确保系统能够高效节能地运行并延长设备寿命。此外，文章还强调了触摸屏组态的关键要素，如压力趋势图和手动干预界面的设计。最后，作者分享了一些调试经验和常见故障排除方法，如模拟量处理、滤波算法的应用以及紧急情况下的手动模式保障。适合人群：从事工业自动化领域的工程师和技术人员，尤其是对PLC编程和恒压供水系统感兴趣的读者。使用场景及目标：适用于需要设计和实施恒压供水控制系统的工程项目，帮助工程师掌握从硬件选型到软件编程再到系统调试的完整流程，最终实现稳定的供水控制。其他说明：文中提供了详细的IO分配表、梯形图逻辑示例和触摸屏界面设计建议，有助于读者更好地理解和应用相关技术。同时，作者还分享了许多实践经验，为实际操作提供了宝贵的指导。

西门子S7-200 PLC与组态王联动3泵恒压供水系统全面解析：梯形图程序、接线图及组态设计: 内容概要：本文详细介绍了利用西门子S7-200 PLC和组态王搭建三泵恒压供水系统的全过程。首先阐述了硬件配置，包括IO分配、接线方式以及变频器的使用方法。接着深入探讨了PLC程序的核心逻辑，特别是压力闭环控制和泵轮换策略的设计。文中还分享了组态王界面设计的经验，强调了动态压力曲线和手自动切换功能的重要性。最后，作者结合实际案例，指出了调试过程中常见的问题及其解决方案。适合人群：从事工业自动化领域的工程师和技术人员，尤其是对PLC编程和HMI设计有一定基础的人群。使用场景及目标：适用于需要构建高效稳定的恒压供水系统的工程项目。主要目标是确保系统能够根据管网压力自动切换水泵，保持压力稳定，同时提高设备使用寿命和维护效率。其他说明：文章不仅提供了详细的理论讲解，还包括了许多实用的操作技巧和经验分享，有助于读者更好地理解和掌握相关技术和应用场景。

Rust跨语言回调队列：MPSC通道集成.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。 Rust 以内存安全、零成本抽象和并发高效的特性，重塑编程体验。无需垃圾回收，却能通过所有权与借用检查机制杜绝空指针、数据竞争等隐患。从底层系统开发到 Web 服务构建，从物联网设备到高性能区块链，它凭借出色的性能和可靠性，成为开发者的全能利器。拥抱 Rust，解锁高效、安全编程新境界！

批处理文件：批量删除当前文件夹下所有文件名里的幻灯片这三个字: 将ppt转换成图片时，所有图片的文件名中会出现“幻灯片”三个字，这时，可以将本批处理文件复制到对应文件夹内，双击运行后，可以批量删除图片文件名中的“幻灯片”三个字。

Rust音频处理实战：CPAL库实现实时音频流处理.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。 Rust 以内存安全、零成本抽象和并发高效的特性，重塑编程体验。无需垃圾回收，却能通过所有权与借用检查机制杜绝空指针、数据竞争等隐患。从底层系统开发到 Web 服务构建，从物联网设备到高性能区块链，它凭借出色的性能和可靠性，成为开发者的全能利器。拥抱 Rust，解锁高效、安全编程新境界！

基于Matlab平台的共享电动汽车两阶段选址调度模型：高效运行在Matlab与cplex环境下的解决方案: 内容概要：本文详细介绍了如何利用Matlab和CPLEX构建共享电动汽车的两阶段优化模型。首先，通过整数规划确定最佳充电站位置，考虑用户需求覆盖率和建设成本之间的权衡。其次，采用动态调度模型处理实时车辆分配，确保各区域需求得到满足的同时优化运营成本。文中还讨论了数据预处理技巧如K-means聚类、移动平均滤波以及CPLEX求解器的高效配置方法。适合人群：从事交通规划、物流配送等领域研究的专业人士，尤其是对数学建模和优化算法有一定了解的研究人员和技术开发者。使用场景及目标：适用于城市交通管理部门、共享汽车运营商等机构进行电动车基础设施布局规划和日常运营管理。主要目的是降低建设和运营成本，提高用户体验和服务质量。其他说明：作者分享了许多实践经验，包括如何避免常见错误（如矩阵转置问题）、提高求解速度的小技巧（如稀疏矩阵的应用）以及如何通过可视化工具辅助结果分析。此外，还提到了一些潜在改进方向，如加入充电桩排队时间和路网结构的影响因素。

基于海马体记忆回放机理的机器人全局路径优化算法研究论文: 内容概要：本文旨在构建一种基于记忆序列回放机理的机器人全局路径优化算法模型。通过模拟大脑海马体和前额叶中的记忆回放过程，改进了传统的机器人导航算法。模型采用自适应的Top-k竞争规则和回报折扣思想，使得智能体能够在复杂障碍物环境中快速找到最短路径。实验结果显示，智能体经过1-3次探索即可收敛到稳定状态，并找到最短路径，验证了模型的有效性和快速收敛性。适合人群：对机器人导航、智能算法、神经科学感兴趣的科研人员，尤其是从事机器人路径规划和认知计算模型研究的学者和工程师。使用场景及目标：①适用于复杂环境下的机器人路径规划与导航任务；②用于研究大脑记忆回放机制及其对决策过程的影响；③提高机器人在未知环境中的自主学习和适应能力。其他说明：该模型不仅在仿真环境中表现优异，还在真实机器人实验中得到了验证。通过ROS平台和MATLAB接口，实现了对智能小车的有效控制和路径优化。此外，模型的收敛性和鲁棒性优于现有的DN2和基于小脑及基底神经节的混合模型，显示出更强的适应性和更高的性能。

基于迁移学习的端到端发音检错研究.pdf: 基于迁移学习的端到端发音检错研究.pdf

Rust内存安全容器：ThinVec优化实践.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。 Rust 以内存安全、零成本抽象和并发高效的特性，重塑编程体验。无需垃圾回收，却能通过所有权与借用检查机制杜绝空指针、数据竞争等隐患。从底层系统开发到 Web 服务构建，从物联网设备到高性能区块链，它凭借出色的性能和可靠性，成为开发者的全能利器。拥抱 Rust，解锁高效、安全编程新境界！

基于单片机酒精检测报警器：AD0809与AD0832版本的声光报警及LCD1602显示功能: 内容概要：本文详细介绍了基于51单片机的酒精检测报警器的设计与实现，涵盖了硬件选型、软件编程、功能实现等方面的内容。文中提供了两种不同版本的ADC芯片（AD0809和AD0832），分别阐述了它们的工作原理、代码实现及其优缺点。此外，文章还讨论了系统的各个组成部分，如MQ-3酒精传感器、LCD1602显示屏、按键设置、声光报警等，并给出了详细的代码示例和调试技巧。适合人群：对单片机开发有一定基础的学习者、电子爱好者、从事交通安全管理的技术人员。使用场景及目标：适用于防止酒驾的安全监控场景，旨在提高驾驶安全性和减少交通事故的发生。通过本项目的实践，读者可以掌握单片机的基本应用技能，了解传感器数据采集、处理和反馈机制。其他说明：文中不仅提供了完整的代码实现，还分享了许多实际开发过程中可能遇到的问题及解决方案，如传感器预热、按键防抖、ADC读取时序等。同时，作者强调了该项目作为DIY作品，在正式应用中应注意合法合规性。

基于VSG的光储并网控制策略及低压穿越控制策略: 内容概要：本文详细介绍了基于虚拟同步发电机（VSG）技术的光储并网系统控制策略，涵盖光伏MPPT控制、储能直流稳压、VSG控制、虚拟阻抗增加及低压穿越控制等方面。针对每个控制策略提供了具体的实现代码和应用场景分析，强调了这些策略在保障电力系统稳定性方面的重要作用。文中不仅讨论了理论背景，还给出了大量实用的代码片段和技术细节，有助于理解和实施这些先进的控制策略。适合人群：从事新能源发电系统设计、开发和维护的专业技术人员，特别是对光储并网技术和VSG控制感兴趣的工程师。使用场景及目标：适用于希望深入了解光储并网系统内部工作机制的研究人员和技术爱好者；旨在为解决实际工程项目中的技术难题提供指导和支持，确保光储并网系统能够在各种复杂的电网环境下稳定运行。其他说明：文章中提到的技术和方法已在多个实际案例中得到验证，能够有效提升系统的性能和可靠性。此外，作者还分享了一些调试经验和常见错误规避技巧，对于初学者非常有价值。

中兴ZXD2400电源电路图（电子版PDF格式，非PCB图，包含详细的线路图和图纸）: 内容概要：本文详细解析了中兴ZXD2400电源电路图4.1版本，涵盖输入、转换和输出三大部分。输入部分介绍了LC滤波电路的作用及其参数计算方法；转换部分围绕UC3842芯片的工作原理展开，展示了其通过比较反馈电压和参考电压来实现电压稳定转换的功能；输出部分讨论了线性稳压芯片的应用。此外，还深入探讨了PWM控制、MOSFET驱动、补偿网络、电压采样、保护电路等关键设计细节，并提供了多个Python代码片段用于参数计算和电路特性模拟。文章不仅帮助读者理解电源电路的工作机制，还分享了许多实际操作经验和注意事项。适合人群：从事电源设计的技术人员、电子工程师、DIY爱好者。使用场景及目标：适用于希望深入了解电源电路设计原理和技术细节的人群，旨在提高读者对电源系统的理解和实际应用能力。其他说明：文中提供的Python代码片段有助于快速定位关键芯片位置、计算重要参数，便于理论联系实际。同时提醒读者关注版本变更说明，避免因使用旧版图纸而导致的问题。

派克气动专业的系统组件.pdf: 派克气动专业的系统组件

健身房管理系统源代码.zip: 健身房管理系统源代码.zip

Global site tag (gtag.js) - Google Analytics

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene practice

评论

发表评论

相关推荐

移动电商

Top 10 Books For Advanced Level Java Developers

RESTful

Androd app

Jenkins-CI

JNLP

Eclipse3.4 + Axis2 Configuration

XML configuration for Spring jsf hibernate

Final Usage

Java tips

Java Connect Pool

Apache Solr and Tomcat6 Search engine

Java Multiple process (PID)

Glassfish V2 And NetBean6

Spring用回调HibernateCallBack方法

Java中的浅复制与深复制

Future pattern

Log4j Configuration (Recitation)

JasperReport usage

Java中的序列化(转）

最近访客更多访客>>