阅读更多

word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch、Luke插件。

 

自1.0之后,在1.1和1.2中,word分词有了重大改进,优化了分词算法、利用多线程提升分词速度、支持分布式、支持资源变化自动检测、新增了全切分算法、支持三元模型、支持Luke插件、增加gradle支持等等,同时,word1.2支持最新的ElasticSearch1.5.1、Lucene4.10.4、Solr4.10.4以及Luke4.0。

 

更多细节请查看:word分词主页

 

word分词的分词效果怎么样?请看:Java开源项目cws_evaluation:中文分词器分词效果评估

 

 

来自: github
2
1
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 为什么Java要求多用组合,少用继承?

    最近有一个要好的朋友去阿里大厂面试Java高级工程师,在第二轮面试的过程中,面试官提了一个问题:“解释下Java项目中为什么要求多用组合,少用继承?朋友觉得这个题目既熟悉,又陌生,毕竟继承与组合在一开始学习Java时就要求掌握的,但是教学过程中只是说了它们的概念及基本理论知识,没有介绍它们之间孰优孰弱的问题,实际开发中也没有刻意去将它们进行比较。一时间竟然答不上来。那么面试官为什么要问这个问题呢?

  • 浅谈继承优缺点以及特点

    一、什么是继承? 继承是面向对象三大特征之一,可以让类和类之间产生父子类的关系。可以使得子类具有父类的属性和方法,还可以在子类中重新定义,或者添加新的属性和方法。 public class Fu { public void show() { System.out.println("Fu类show方法被调用"); } } public class Zi extends Fu { public void method() { Syste...

  • 为什么说Java中要慎重使用继承

    JAVA中使用到继承就会有两个无法回避的缺点:打破了封装性,迫使开发者去了解超类的实现细节,子类和超类耦合。超类更新后可能会导致错误。继承打破了封装性关于这一点,下面是一个详细的例子(来源于Effective Java第16条)这里自定义了一个HashSet,重写了两个方法,它和超类唯一的区别是加入了一个计数器,用来统计添加过多少个元素。写一个测试来测试这个新增的功能是否工作:运行后会发现,加入了...

  • 继承在软件工程中的意义

    软件重用:在两次或多次不同的软件开发过程中重复使用相同的或相似软件元素的过程。 软件元素包括程序代码,测试用例,设计文档,设计过程,需要分析文档甚至领域知识。 流行地软件重用技术: 库函数(面向过程) 类库(面向对象)比如MFC 模板:比如文档模板,网页模板等 设计模式:重用设计的技术 构件(比如:按钮)  构架(系统的草图)  框架(为系统搭建的“架子”)

  • 为什么extends是有害的(二)

    [/接上一篇]有一天,有人也许运行这个代码并且注意到Stack没有运行的如想象的那么快,并且能够在重负荷下使用。你能够重写Stack,以至于它不用ArrayList并且继续提高Stack的效率。这是新的倾向的和有意义的版本:[/代码]class Stack {     private int stack_pointer = -1;     private Object[] stack = new 

  • 全面理解Java中继承关系

    Java面向对象(三) 继承和final实例 继承 概述 继承是面向对象思想的三大特性之一,使类与类之间产生特殊 - 一般的关系,即is-a关系。 继承是从已有类中派生出新的类,新的类能吸收已有类的属性和方法,并且能拓展新的属性和行为。 在Java中使用extends关键字表示继承,语法表示为: class 子类 extends 父类{} 子类被称为派生类,父类又被称为超类。 子类...

  • 转:为什么extends是有害的

    概述  大多数好的设计者象躲避瘟疫一样来避免使用实现继承(extends 关系)。%80的代码应该完全用interfaces写,不用具体的基类。事实上,四人帮的设计模式的书大量的关于怎样用interface继承代替实现继承。这个文章描述设计者为什么有这样的怪癖的想法。    Extends是有害的;也许对于Charles Manson这个级别的不是,但是足够糟糕的它应该在任何的可能的时候被避开。四...

  • 对于初学者学习Java语言的建议(转载)

    初学者的任务是掌握Java的语言规则和养成良好的编程习惯,其次才谈到对类库使用的熟练程度,再其次是OO思想的掌握与应用,再其次就是Design Pattern的问题了。      在这里我只想介绍几个对成功完成第一个阶段很有用的资料。      以下按照循序渐进的顺序进行:      1.The Java Tutorial和它的examples:          ftp://ftp.javaso

  • Java:继承的目的及缺陷

    在java中继承好像占用很重要的位置,很多地方多次强调,但这并不意味着必须使用它。我们要慎用这门技术。 那么到底什么时候使用继承?一个最清晰的判断方法就是问问自己是否需要从子类向父类进行向上转型,如果必须向上转型,则继承是必须的。 继承的缺陷 image.png image.png ...

  • 为什么说JAVA中要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public class My...

  • 3.java继承的底层本质

    实际我们new子类的过程是,先new一个父类,再new一个子类,只是我们不需要这么做,java内部这么操作。 就以上知识点,我们用一个例子来理解: class Father{ Father(){ System.out.println("父类"); } void Fat(){ System.out.println("!"); } } class Son extends Father{ Son(){ ...

  • 大佬救救--Tomcat 加载dubbo-admin 出现的异常

    Tomcat 加载dubbo-admin 出现的异常 29-Apr-2021 17:40:52.103 信息 [localhost-startStop-1] org.apache.catalina.startup.HostConfig.deployWAR Deploying web application archive [G:\Developer\apache-tomcat-8.5.31\apache-tomcat-8.5.31\webapps\dubbo-admin-2.6.0.war] 29-Apr-

  • java继承的缺陷_java继承的一些问题

    如果在父类中,你声明了一个静态变量。然后你有两个子类继承了这个父类。我们想看看这两个子类调用继承的父类的类变量a是不是同一个值。这时候注意,我们在子类的时候不能重写static int a = a+2; 因为你一旦 这样重写了,那么这个子类的a肯定就不是父类的那个a了,那么这时候你想得写成a=a+2;但是这时候就有个问题了。你不能在子类中直接写a=a+2,只能在子类的初始化块中写a=a+2或者在方...

  • Fun和Do(继承和多态

    Fun和Do(继承和多态 描述 程序填空输出指定结果 #include <iostream> using namespace std; class A { private: int nVal; public: void Fun() { cout << "A::Fun" << endl; }; void Do() { cout &lt...

  • 02Java面向对象进阶-2. 继承的好处和弊端

    02Java面向对象进阶-2. 继承的好处和弊端*

  • 求助,运行tomcat报错,实在不会了

    INFO context.ContextLoader - Root WebApplicationContext: initialization started INFO context.WebxComponentsContext - Refreshing Root WebApplicationContext: startup date [Tue Mar 03 14:45:22 CST 2020];...

  • iOS架构师之路:慎用继承

    最近在看大神Casa的文章《跳出面向对象思想(一) 继承》,脑洞大开。文章给我们展示了一个随着产品需求不断变化的例子,该例子中通过继承实现不同页面的搜索视图和搜索逻辑的代码复用,随着产品需求的演变,最后导致继承的搜索功能层级越来越深,相互依赖越来越严重,最后导致拔出萝卜带出泥,又随着个性化需求的发展,最后代码变得越来越混乱。相信有经验的开发人员都经历过这方面的痛苦。继承对代码复用来说非常好用,但同

Global site tag (gtag.js) - Google Analytics