论坛首页 Java企业应用论坛

发布IK Analyzer 3.0 中文分词器

浏览 64773 次
该帖已经被评为精华帖
作者 正文
   发表时间:2010-02-27  
linliangyi2007 写道
MultiArrow 写道
linliangyi2007 写道
kexzcle 写道
请问,IK词典的配置问题,IKAnalyzer.cfg.xml 放在哪里都无所谓是么?

里面配置 /ext_stopwords.dic

那IKAnalyzer.cfg.xml 放在src/ 

同样ext_stopwords.dic 也放到src/ 下..我试了下没有作用呢,停止词! 是否配置错误?


IKAnalyzer.cfg.xml可以放在src下,ext_stopwords.dic则是根据你在cfg中的配置位置来放置,请参考使用文档,里面都有详细的描述了。

我也有这个问题,文档看过了,而且在加载的时候控制台可以看到已经加载了IKAnalyzer.cfg.xml,IKAnalyzer.cfg.xml和ext_stopwords.dic是在同一文件夹中。但是搜索的时候还是没有过滤到ext_stopwords.dic出现过的字。
补充一下:我使用的是SSH。


1。确认你的词典文件的位置确实正确,经常发生扩展词典文件没有被MyEclipse发布到AppServer的运行目录下的情况。
2.确认词典文件的编码是无BOM的UTF-8方式的。

试了N次了,还是不行,决定改用数据库存放扩展的词汇,然后用IK的API加载到内存中。
0 请登录后投票
   发表时间:2010-02-28  
能不能给你提出一些优化点,我再使用过程中又些地方不方便
怎样才能方便联系到你
0 请登录后投票
   发表时间:2010-02-28  
luocanrao 写道
能不能给你提出一些优化点,我再使用过程中又些地方不方便
怎样才能方便联系到你


mail: linliangyi2005@gmail.com
QQ : 36668534
欢迎提出你的建议和意见
0 请登录后投票
   发表时间:2010-05-05   最后修改:2010-05-05
毕设用到这个.///. 不知道在写参考文献的时候是不是可以把这个贴子的网址写上去... 
0 请登录后投票
   发表时间:2010-05-13  
严重支持,最近准备改造和升级自己开发的一套cms系统搜索引擎,呵呵
0 请登录后投票
   发表时间:2010-06-02  
大虾,咨询一下:lucene3.0.1和IKAnalyzer3.2.3Stable或IKAnalyzer3.2.0Stable一起用搜索时报java.lang.ClassNotFoundException: org.wltea.analyzer.lucene.IKQueryParser。JDK1.6
0 请登录后投票
   发表时间:2010-06-02  
qiuwei1003 写道
大虾,咨询一下:lucene3.0.1和IKAnalyzer3.2.3Stable或IKAnalyzer3.2.0Stable一起用搜索时报java.lang.ClassNotFoundException: org.wltea.analyzer.lucene.IKQueryParser。JDK1.6


很可能是你吧停止词典放错路径了,在src目录下没有ext_stopword.dic这个文件。

如果你不需要这个词库,应该修改IKAnalyzer.cfg.xml把其中相关配置注释掉
0 请登录后投票
   发表时间:2010-07-09  
呵呵,一个帖子看下来,学习到很多东西,楼主发布源码,同时还这么尽力的回答问题,人品没得说。使用ing
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics