论坛首页 Java企业应用论坛

中文分词 mmseg4j

浏览 21290 次
该帖已经被评为良好帖
作者 正文
   发表时间:2009-04-02  
whaosoft 写道
你自己写的???


是我自己写的, 有问题吗?
0 请登录后投票
   发表时间:2009-04-03  
chenlb 写道
whaosoft 写道
你自己写的???


是我自己写的, 有问题吗?


  你的回答   牛!
0 请登录后投票
   发表时间:2009-04-03  
whaosoft 写道
你自己写的???

在JE, 遇到牛的机会很多, 故请不要见怪.
0 请登录后投票
   发表时间:2009-04-06  
哇塞。。。
汗一个
中文分词大学接触过一点点,楼主你不错
0 请登录后投票
   发表时间:2009-04-06  
赞...
话说可以考虑跟我的segc PK试试看...哈哈...

http://github.com/mikeandmore/segc/tree/master
0 请登录后投票
   发表时间:2009-04-06  
mikeandmore 写道
赞...
话说可以考虑跟我的segc PK试试看...哈哈...

http://github.com/mikeandmore/segc/tree/master


PK 那方面?
0 请登录后投票
   发表时间:2009-04-07  
http://groups.google.com/group/mmseg
这是solol 较早前实现的MMSEG分词的java版本。
0 请登录后投票
   发表时间:2009-04-07  
我想我是海 写道
顶最早的mmseg for java的 Solol兄。由于其网站过期而弃用了。已通知solol放出原版下载。


我想我是海 写道
http://groups.google.com/group/mmseg
这是solol 较早前实现的MMSEG分词的java版本。


你比较喜欢顶 solol 兄,

顶 solol 兄是你的自由, 写 mmseg4j 是我的自由。你甚至还可以为 solol 兄的mmseg扩展lucene analyzer

我写 mmseg4j 的目的很简单:学习一种分词算法。
0 请登录后投票
   发表时间:2009-04-07  
chenlb 写道
mikeandmore 写道
赞...
话说可以考虑跟我的segc PK试试看...哈哈...

http://github.com/mikeandmore/segc/tree/master


PK 那方面?

呃。。。忘了说了。。。
性能。。我这个项目的目的是性能的。。。
0 请登录后投票
   发表时间:2009-04-07   最后修改:2009-04-07
mikeandmore 写道
呃。。。忘了说了。。。
性能。。我这个项目的目的是性能的。。。


1.5版的分词速度simple算法是 1100kb/s左右、complex算法是 700kb/s左右,(测试机:AMD athlon 64 2800+ 1G内存 xp)。

simple > paoding(900Kb/s左右) > complex > ik & mik > je

后续的版本努力提升性能....
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics