- 浏览: 62070 次
- 性别:
- 来自: 福州
最新评论
因项目需要对中文进行切词,故找同事要了段代码,现记录下来,以便日后使用
public static String detailData(String text) throws IOException{
String returnStr = "";
//创建分词对象
Analyzer anal = new IKAnalyzer(true);
StringReader reader = new StringReader(text);
//分词
TokenStream ts = anal.tokenStream("", reader);
CharTermAttribute term = ts.getAttribute(CharTermAttribute.class);
while(ts.incrementToken()){
returnStr = returnStr + term.toString()+"#@@#";
}
reader.close();
return returnStr;
}
另:附件1和2放在lib中,附件3放在src根目录
public static String detailData(String text) throws IOException{
String returnStr = "";
//创建分词对象
Analyzer anal = new IKAnalyzer(true);
StringReader reader = new StringReader(text);
//分词
TokenStream ts = anal.tokenStream("", reader);
CharTermAttribute term = ts.getAttribute(CharTermAttribute.class);
while(ts.incrementToken()){
returnStr = returnStr + term.toString()+"#@@#";
}
reader.close();
return returnStr;
}
另:附件1和2放在lib中,附件3放在src根目录
- IKAnalyzer3.2.3Stable.jar (1.1 MB)
- 下载次数: 2
- lucene-core-3.6.0.jar (1.5 MB)
- 下载次数: 1
- src根目录.zip (746 Bytes)
- 下载次数: 1
发表评论
-
Oracle的ORA-02292报错:违反完整性约束,已找到子记录
2019-09-20 10:59 743第一步就是找到子表的记录: select a.constrai ... -
expdp / impdp 用法详解
2017-07-31 14:12 649一 关于expdp和impdp 使用EXPDP和IM ... -
linux常用操作记录
2017-07-18 14:41 4581.获取账号权限 sudo -u orapub -i 2. ... -
visio2016下载以及永久激活
2017-07-17 16:55 7126下载地址:http://www.tc12580.com/vp. ... -
CGLIB介绍与原理
2017-07-14 15:07 527转载至:http://blog.csdn.net/zghwai ... -
cmd查看指定端口使用情况
2017-05-31 17:30 400netstat -ano|findstr 8080 数据含义 ... -
解决java连接SQLSERVER数据库之驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:Could not gen
2017-04-02 22:52 3417操作系统win10 x64,sql2016 这个问题是JDK ... -
SQL Server2016企业版 附全版本key
2017-03-29 21:28 3454Microsoft SQL Server 2016是一个全面的 ... -
共用局域网同一个IP
2017-03-15 17:03 5901.先arp -a获取IP的MAC地址 2.本地连接-> ... -
sql删除重复数据
2017-01-09 10:49 379delete from [表名] where id not i ... -
Windows 2003服务器硬盘增加空间
2016-05-07 14:21 685大家都知道,windows服务器下面是无法直接将新升级的磁盘空 ... -
SQL2005数据库变成"可疑"的解决方法
2015-08-04 18:00 514DBName为数据库名 USE MASTER GO SP ... -
MongoDB可视化IDE(MongoVUE 1.6.9破解版)
2015-07-27 16:45 1289如题,仅作安装包备份 安装操作: 1.先安装Installe ... -
已成功加载 或删除WmiApRpl服务 解决方案
2015-06-01 13:45 2015来源 loadpref ID:1000 ... -
Java连接Access数据库(JDBC)
2015-05-29 10:06 952因项目需求,需要Access数据库,现将测试通过代码记录下来, ... -
Mongodb常用操作记录
2015-04-22 09:01 494安装:mongod --dbpath "C:\mon ... -
windows各版本序列号集合
2014-11-13 10:31 1151因经常使用,避免每次都上网到处找,在此做了集合(不定期更新) ... -
windows2003添加服务
2013-11-16 17:05 927因工作需要所以上网查 ... -
sql替换某字段内容的语句
2013-10-23 17:31 1689update 表名 set 字段名=replace(cast( ... -
带有OUTPUT的INSERT,DELETE,UPDATE使用方式记录
2013-08-21 11:00 7367因需求的关系需要将修改的值返回,故查了些资料发现了OUTPUT ...
相关推荐
中科院切词工具包,直接导入eclipse就可运行
java 中文字转为英文java 中文字转为英文java 中文字转为英文
java实现中文排序,按数字字母汉字的顺序进行排序
Java汉字转拼音(支持多音字)
java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java汉字转拼音java...
1、lucene-core-3.6.0.jar 2、IKAnalyzer2012.jar(主jar包) 3、IKAnalyzer.cfg.xml(分词器扩展配置文件) 4、stopword.dic(停止词典) 5、IkSegmentation.java(样例类)
Java实现汉字转拼音功能,包括首字母和全拼,为大家减少时间,为此提供便捷。
java将汉字转化为拼音大小写(提取首字母,将汉字转化为拼音首字母大小写的相关算法)
语言入门 第一章 Java语言的产生及其特点 第二章 Java程序开发与运行环境 第三章 Java程序设计基础 第四章 Java应用程序的基本框架 第五章 Java的类 ...JAVA_Thinking in Java(中文版 由yyc,spirit整理).chm
该程序是一个java的中文汉字字频统计,从诸如txt文件中读取语料,然后生成一个前100个高频汉字的字频统计结果的txt文件,并且还会生成前100、200、600、2000、等汉字的字频和的另一个txt文件。该程序是借用treeMap来...
Java中文成Unicode码及从Unicode码转成中文
4. * 汉字按照拼音排序的比较器 5. * @author KennyLee 2009-2-23 10:08:59 6. * 7. */ 8.public class PinyinComparator implements Comparator<Object> { 9. public int compare(Object o1, Object o2) { 10...
实现在输入框输入一个汉字字符就能获取该汉字在HZK16里的字模数据
Java 汉字 拼音 部首 笔画 笔画数目 Java,获取汉字拼音、部首、笔画、笔画数目源文件、源码
本手册为JDK-API-1.8版本,java中文版api手册。JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具...
java中汉字得到首字母大写 一般得到姓名的第一个字母时用得到! 很实用。
Java自定义实现本地语言与ASCII之间的互相转换。可在开发项目中直接调用的工具类。
Head First Java 中文高清版Head First Java 中文高清版Head First Java 中文高清版