`
hdxiong
  • 浏览: 372247 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Lucene 2.4里一些过期方法的解决方案收藏

阅读更多

    今天更新网站的搜索引擎到Lucene 2.4.0 ,这个是 2008年10月8日发布的版本,结果发现许多方法和类被声明为过期(@deprecated),且某些方法和类被声明在3.0引擎中将被删除。我这里只写出自己用到的几个方法和类,并替换为新版本的。


    1 IndexWriter 的构造器

    IndexWriter writer = new IndexWriter(indexPath, getAnalyzer(), true); 
    其中
    indexPath 为目录,是一个字符串,
    getAnalyzer()是分析器
    true 代表重建索引

    这个方法需要替换为

    IndexWriter writer = new IndexWriter(indexPath, getAnalyzer(), true, IndexWriter.MaxFieldLength.UNLIMITED);
    其中前面三个完全相同,
    第四个参数代表允许的最大字段长度,UNLIMITED代表不限制长度


    2 Field.Index.UN_TOKENIZED
    这个被替换为
    Field.Index.NOT_ANALYZED
    没啥特殊的,改了一个名字而已

    Field.Index.TOKENIZED 替换为 Field.Index.ANALYZED

    3 IndexWriter.flush();
    替换为
    IndexWriter.commit();

    4 org.apache.lucene.search.Hits;
    这个类将在3.0中被删除
    新的搜索代码如下

          IndexSearcher isearcher = new IndexSearcher(indexPath);
          BooleanClause.Occur[] clauses = { BooleanClause.Occur.SHOULD, BooleanClause.Occur.SHOULD };

          TopDocCollector collector = new TopDocCollector(10); // 启用这个
          Query query = MultiFieldQueryParser.parse(queryString, new String[] { "subject", "content" }, clauses, getAnalyzer());
          isearcher.search(query, collector); // 作为参数
          ScoreDoc[] hits = collector.topDocs().scoreDocs; // 拿到结果
          List<Long> rtn = new ArrayList<Long>();
          Long id;
          Long idParent;
          int docId;
          for (int i = 0; i < hits.length; i++) { // 循环
            docId = hits[i].doc; // 一个内部编号
            Document doc = isearcher.doc(docId); // 通过编号,拿到文档
          }
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics