阅读更多

34顶
0踩

编程语言
IK Analyzer 3.1.1Stable版本是基于3.1.1GA2的变更:

1.修订了IK Analyzer 与 solr项目集成时,出现指针越界的不兼容的问题。
感谢北京何健网友的测试帮助。


下载 :IKAnalyzer3.1.1稳定版完整包.rar

更多详细请参看《IKAnalyzer中文分词器V3.1.1使用手册.pdf》

或访问本人Blog:http://linliangyi2007.iteye.com/blog/429960

IKAnalyzer3.0介绍

IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer 已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0 则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。

IKAnalyzer3.0特性

    * 采用了特有的“正向迭代最细粒度切分算法“,具有50万字/秒的高速处理能力。
    * 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。
    * 优化的词典存储,更小的内存占用。支持用户词典扩展定义
    * 针对Lucene全文检索优化的查询分析器IKQueryParser(作者吐血推荐);采用歧义分析算法优化查询关键字的搜索排列组合,能极大的提高Lucene检索的命中率。


34
0
评论 共 14 条 请登录后发表评论
14 楼 linliangyi2007 2011-05-01 01:17
qzxfl008 写道
支不支持lucene3.1.0啊


兄弟,你真的out了!!看看这个帖子的日期吧!!

IK已经发布到3.2.8了,从3.2开始支持lucene 3.0的,已经出了8个版本了
13 楼 qzxfl008 2011-04-30 15:46
支不支持lucene3.1.0啊
12 楼 lpssflxs 2010-08-17 18:06
要有C#就好了
11 楼 squall140 2010-02-21 10:07
我用的不是很深入,不过还是学习一下,支持稳定版本!
10 楼 linliangyi2007 2009-10-13 18:06
fxsjy 写道
smallseg -- 开源的,基于python语言开发的轻量级的中文分词工具包
http://code.google.com/p/smallseg/


看到中国开源的规模在一点点变大中,呵呵!!

BTW:python的语法总是那么的精炼漂亮啊
9 楼 fxsjy 2009-10-13 17:19
smallseg -- 开源的,基于python语言开发的轻量级的中文分词工具包
http://code.google.com/p/smallseg/

8 楼 linliangyi2007 2009-08-26 16:16
zhujianwu 写道
能提供最新版本的源码吗?谢谢,或者发一份给我,非常感谢
willen_zhu@126.com




项目地址:http://code.google.com/p/ik-analyzer/ 使用SVN下载源码吧
7 楼 zhujianwu 2009-08-26 16:13
能提供最新版本的源码吗?谢谢,或者发一份给我,非常感谢
willen_zhu@126.com
6 楼 gigivszhao 2009-08-26 14:09
IKAnalyzer 的分词 应该是我用过最好的。超过其他的分词,想用的可以试一下。
5 楼 whaosoft 2009-08-26 12:05
有谁用过,好用不
4 楼 linliangyi2007 2009-08-25 23:10
huncent 写道
http://linliangyi2007.javaeye.com/blog/42996
汗,跳到http://hideto.javaeye.com/blog/42996去了,javaeye没根据用户验证博客文章?

汗死,少考了一个0,火箭射到火星去鸟
3 楼 huncent 2009-08-25 21:16
http://linliangyi2007.javaeye.com/blog/42996
汗,跳到http://hideto.javaeye.com/blog/42996去了,javaeye没根据用户验证博客文章?
2 楼 Jekey 2009-08-25 18:15
1 楼 fys124974704 2009-08-25 17:36
有空试试,一直在寻找一个完美的中文分词器

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • windows网络编程之tcp/ip

    适用人群windows网络编程的初学者课程概述课程简介:这部教程是windows网络编程课程的第一部分课程:tcp/ip协议后续会有第二部分课程:udp/ip协议以及第三部分课程http协议的课程发布。希望能够帮助到大家。课程内容:c/s模型的编码,5种windows网络模型:select,异步选择,事件选择,重叠io,完成端口,以及基础理论知识的讲解。课程分八章,总课时100课时左右,每日更新2~5节.课程代码会带大家一行一行书写,保证大家都能够学会。课程适合人群:网络编程爱好者,网络编程初学者课程章节:第一章 c/s模型的讲解以及代码实现第二章 select模型的讲解以及代码实现第三章 异步选择模型的讲解以及代码实现第四章 事件选择模型的讲解以及代码实现第五章 重叠i/o模型的讲解以及代码实现第六章 完成端口模型的讲解以及代码实现第七章 tcp/ip基础知识的讲解,包括网络分层,三次握手,四次挥手,协议头等等。

  • socket 请求与接收事例

    客户端 error_reporting(E_ALL); set_time_limit(0); echo "TCP/IP Connection\n"; $port = 1935; $ip = "127.0.0.1"; /*  +-------------------------------  *    @socket连接整个过程  +----------------

  • C# Socket编程 同步以及异步通信(转)

    C# Socket编程 同步以及异步通信(转) (http://blog.sina.com.cn/s/blog_4e2cd3ce0100lz97.html) 套接字简介:套接字最早是Unix的,window是借鉴过来的。TCP/IP协议族提供三种套接字:流式、数据报式、原始套接字。其中原始套接字允许对底层协议直接访问,一般用于检验 新协议或...

  • WSAEventSelectI/O模型中FD_WRITE事件的处理以及如何发送数据

    网上很多人都在问什么时候才会触发FD_WRITE,触发了我该怎么发送数据,如果没有触发,我又该如何发数据? 当第一次连接成功的时候会触发FD_WRITE,还有就是当send 返回SOCKER_ERROR并且 WSAGetLastError()返回 WSAEWOULDBLOCK 这时表示缓冲区已满,当数据发送出去,又有空闲的缓冲区时会触发FD_WRITE,表示缓冲区可写。 也就是说只有缓

  • 关于winsock中网络编程事件模型和窗口消息模型中FD_WRITE的理解与数据的发送需要注意的关键点

    Winsock异步模式I/O模型WSAEventSelect的使用及FD_WRITE事件的触发机制 http://oliver258.blog.51cto.com/750330/423813 1.Winsock同步阻塞方式的问题 在异步非阻塞模式下,像accept(WSAAccept),recv(recv,WSARecv,WSARecvFrom)等这样的winsock函数调用后马上返回,

  • 【C#】socket接收消息 同步/异步

    socket接收消息 同步/异步

  • FD_WRITE 和 FD_READ的触发条件

    FD_WRITE触发条件: 1.client 通过connect(WSAConnect)首次和server建立连接时,在client端会触发FD_WRITE事件 2.server通过accept(WSAAccept)接受client连接请求时,在server端会触发FD_WRITE事件 3.send(WSASend)/sendto(WSASendTo)发送失败返回WSAEWOULDBLOCK

  • FD_WRITE

    为什么80%的码农都做不了架构师?>>> ...

  • 对Socket CAN的理解(3)——【Socket CAN发送数据流程】

    转载请注明出处:http://blog.csdn.net/Righthek 谢谢!     对于本文,我们将从用户层使用Socket CAN进行数据发送时,数据从用户空间到底层驱动的整个通信流程,用户层使用Socket CAN可参考上一篇文章《对Socket CAN的理解(2)——【Socket的原理及使用】》。     当我们在用户层通过socket进行CAN...

  • WSAAsyncSelect注意的地方

    SOCKET模型

  • 异步SOCKET编程-发送和接收数据[转] 异步SOCKET编程-发送和接收数据[转]

    我本想把发送和接收分开作为两部分,但是最后我决定只略微解释一下 FD_READ ,留下更多的时间来说明更复杂的 FD_WRITE , FD_READ 事件非常容易掌握. 当有数据发送过来时, WinSock 会以 FD_READ 事件通知你, 对于每一个 FD_READ 事件, 你需要像下面这样调用 recv() :int bytes_recv = recv(wParam, &data,

  • c++ socket 异步编程

    在网络通讯中,由于网络拥挤或一次发送的数据量过大等原因,经常会发生交换的数据在短时间内不能传送完,收发数据的函数因此不能返回,这种现象叫做阻塞。 Winsock对有可能阻塞的函数提供了两种处理方式:阻塞和非阻塞方式。 阻塞模式      在阻塞方式下,收发数据的函数在被调用后一直要到传送完毕或者出错才能返回。在阻塞期间,被阻的函数不会断调用系统函数GetMessage()来保持消息循环

  • Windows异步套接字(WSASocket)

    异步套接字: 如果使用阻塞的套接字的话,在控制台下还好!如果是WIN32程序的话,那么就容易造成界面的假死,因为接收函数一直等待有消息进来之后才会被返回!所以此时界面一直属于假死的状态,如果你乱动的话,那么就容易真死了。解决办法如下: 第一:使用多线程技术,多线程和SOCKET结合的话,可以使用单独一个线程来接收消息。这样即使接收函数阻塞了也不会影响其他线程,例如界面线程。但是如果使用多线程的

  • socket异步和同步使用

    参考了许多大侠的代码,才写出来东东,没对数据做校验,希望给正在研究这方的东东的人一点参考.里面包含文件以及DataTable传输等

  • Socket异步发送读取,客户端和服务端

    Socket的异步调用发送和读取。C#,winfrom

  • C#socket异步发送与接收类

    实现SOCKET异步网络传输 包含发送、接收、事件

Global site tag (gtag.js) - Google Analytics