论坛首页 Java企业应用论坛

用海量的分词系统,在lucene建立索引库,大数据量的时候出问题~!

浏览 10939 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2006-09-15  
海量的分词的精度准确率还是不错的
就是在建立索引库的时候数据库几千万条记录,出这个错误,但是索引一篇文章几百k的时候都不会出现这个问题~
#
# An unexpected error has been detected by HotSpot Virtual Machine:
#
#  EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x033ecd14, pid=592, tid=3484
#
# Java VM: Java HotSpot(TM) Client VM (1.5.0-b64 mixed mode, sharing)
# Problematic frame:
# C  [HLSSplit.dll+0x1cd14]
#
# An error report file with more information is saved as hs_err_pid592.log
#
# If you would like to submit a bug report, please visit:
#   http://java.sun.com/webapps/bugreport/crash.jsp
#
应该是调用海量的c写的dll库出错
这个问题又什么好一点的解决办法么?
用过的兄弟给个建议~



   发表时间:2006-09-15  
专业搜索引擎,lucene只是模拟!
基于lucene的compass也不错!
0 请登录后投票
   发表时间:2006-09-15  
nutch怎么样呀?
0 请登录后投票
   发表时间:2006-09-18  
没用过,compass也是在看spring技术论坛时发现的!
0 请登录后投票
   发表时间:2006-09-18  
这个问题始终困扰着我,比较郁闷
0 请登录后投票
   发表时间:2006-09-18  
galaxystar 写道
没用过,compass也是在看spring技术论坛时发现的!


个人不是很赞成使用那个框架
实际上lucene的使用接口很简洁了,建立索引 搜索  高亮等等,里面的一些主要类都可以通过工场方法继承修改  的~
那个compass 封装了他的使用接口,还有配置文件,繁琐无比
而且性能有待考察

自己使用lucene还可以相对了解里面内部构造....................

0 请登录后投票
   发表时间:2006-09-18  
asdfasdf 写道
galaxystar 写道
没用过,compass也是在看spring技术论坛时发现的!


个人不是很赞成使用那个框架
实际上lucene的使用接口很简洁了,建立索引 搜索  高亮等等,里面的一些主要类都可以通过工场方法继承修改  的~
那个compass 封装了他的使用接口,还有配置文件,繁琐无比
而且性能有待考察

自己使用lucene还可以相对了解里面内部构造....................



基于spring的配制,相对来说,已经可以了!除非你说spring配制很烦,那就直接用annonation!且annonation管理也不是很方便!

还有,java做得搜索引擎,性能一般都很低!没必要谈性能!索引本身的性能依赖于语言本身了!
与c++的search engine比起来,差太多了!
0 请登录后投票
   发表时间:2007-04-23  
GCa
0 请登录后投票
   发表时间:2007-04-23  
oh,no
0 请登录后投票
   发表时间:2007-04-23  
黄金时代
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics