`

IK Analyzer Demo

阅读更多
IK Analyzer 分词器的使用Demo,也是看了我一个朋友的博客,自己理解了下,就放在这里了,代码稍微改了改,希望能对IK Analyzer感兴趣的朋友有帮助。
package com.eric.lucene;

import java.io.IOException;
import java.io.StringReader;

import org.wltea.analyzer.IKSegmentation;
import org.wltea.analyzer.Lexeme;

public class IKAnalyzerApp {

	public static void main(String[] args) {
		IKSegmentation seg = null;
		String text = "苏轼不是圣人,他最可贵的地方是在痛苦彷徨挣扎中,"
				+ "总能把自己的心灵置于更广阔的天地中,如同《赤壁后赋》中横飞而去的老鹤,"
				+ "戛戛于星空夜月,长河大江之上,澄明清澈,皎然不滓。"
				+ "苏轼是一个善于苦中找乐的人,这种乐观与真趣帮他度过了不少难关。"
				+ "画家陈丹青说鲁迅是一个有趣的人,我想,拿来说苏东坡一样也行。";

		StringReader reader = new StringReader(text);
		seg = new IKSegmentation(reader);
		Lexeme lex = null;
		try {
			while ((lex = seg.next()) != null) {
				System.out.print(lex.getLexemeText() + "|");
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

结果:
引用

苏轼|不是|圣人|他|最可|可贵|的|地方|是|在|痛苦|彷徨|挣扎|中|总能|能把|自己|的|心灵|置于|更广|广阔|的|天地|地中|如同|赤壁|后|赋|中|横飞|而去|的|老|鹤|戛戛|于|星空|夜|月|长河|大江|之上|澄明|明清|清澈|皎|然|不|滓|苏轼|是|一个|一|个|善于|于|苦|中|找乐|的人|这种|乐观|与|真|趣|帮|他|度过|过了|不少|难关|画家|陈|丹青|说|鲁迅|是|一个|一|个|有趣|的人|我|想|拿来|来说|苏东坡|东坡|一样|一|样|也行|

分享到:
评论

相关推荐

    IKAnalyzer 中文分词 完整java项目demo

    IKAnalyzer非常易用的java分词工具。可以自定义扩展词汇。 这个是一个完整的java项目demo。直接可以用,不用再去google下载了。添加了几个自定义词汇,测试好用。 运行ika.java里的main方法即可

    IKAnalyzer3.2.8.jar + doc(index.html)+demo 史上最全

    IKAnalyzer3.2.8.jar + doc(index.html)+demo 史上最全

    IKAnalyzer 中文分词demo

    NULL 博文链接:https://skycb.iteye.com/blog/2229099

    solr_5.0_tomcat7_IKAnalyzer中文分词安装及demo

    solr_5.0_tomcat7_IKAnalyzer中文分词安装步奏及demo演示, 步奏详细可用,配图

    IKAnalyzer2012_u6.rar

    IKAnalyzer2012_u6 jar包 +IKAnalyzer中文分词器V2012_U5使用手册.pdf+IKAnalyzer中文分词器V2012使用手册.pdf PS: 中文文档,里面有详细使用demo。下载即用! 非常好用!

    lucene:基于lucene与IKAnalyzer的中文搜索demo及学习记录

    基于lucene与IKAnalyzer的中文搜索demo及学习记录 Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的...

    IKAnalyzer_Demo

    你好页 一个非常简单的个人网站。 这是一个项目,因此请使用fork开始制作自己的项目。 请参阅的演示。 创建自己的 你需要: ☟ ... 现在,您在GitHub帐户上有了该存储库的副本!...分叉后,单击“设置”并重命名您的...

    apache lucene 4.10.0入门单元测试代码demo

    2.通过IKAnalyzer搜索中文关键词 3.复杂的多字段搜索 4.多线程并发搜索,通过contiperf测试,详见:contiperf_百度百科 5.分页搜索 注意:lucene4.10.0需要jdk1.7以上版本,1.6版本以下明确不再支持。lucene支持...

    Lucene6.6.2API示例

    Lucene6.6.2代码示例,处理的原始数据类型是数据库,内含中文分词器IKAnalyzer-6.5.0.jar,支持Lucene6.x以上版本

    ssh集成Lucene4.7demo

    Struts2.3+spring4+hibernate4+Lucene4.7+IKAnalyzer,中文分词,高亮显示,附带MySQL8000条测试数据。仅供学习参考

    ik分词器elastcisearch6.4.2插件源码

    ik分词器,支持elastcisearch6.4.2的源码,如果要使用其他6.X版本的,可以在源码内修改pom.xml中的es版本号。 该源码格式也可为想自己写一个analyzer插件的朋友也可当demo参考

    Lucene 全文检索的 各种例子

    各种分词器都用了,有ikAnalyzer和smartChineseAnalyzer等等分词器。使用jdk7,Lucene-core4.5。非常不错。

    SearchEngineDemo:学习搜索引擎的一些demo

    IkanalyzerIntegrated IKAnalyze中文分词器集成 扩展 IKAnalyzer的停用词和新词 博客学习地址: luceneIndexDetail Lucene索引详解(IndexWriter详解、Document详解、索引更新)博客学习地址: luceneSearchDetail ...

    Lucene搜索引擎开发

    利用开源框架Lucene实现汉字分隔,拼音检索,纠错提示的公共的一个综合demo

    ros by example for indigo volume 2

    当前大多数搞机器人开发的用户所装的ROS是indigo版本,而且是基于Ubuntu14.04的。如果你跑别的版本的rbx代码老出错,不用怀疑,就是代码版本问题!ros by example for indigo volume 1很多地方(包括CSDN)都可以...

Global site tag (gtag.js) - Google Analytics