代码很简单,但我自己摸索了一下午
#coding:gb2312
from ctypes import *
dll=cdll.LoadLibrary("ICTCLAS30.dll")
dll.ICTCLAS_Init(c_char_p("."))
lpText = u"计算所汉语词法分析系统ICTCLAS调用测试"
bSuccess = dll.ICTCLAS_ParagraphProcess(c_char_p(lpText), 1)
print c_char_p(bSuccess).value,lpText
dll.ICTCLAS_Exit()
把这个文件同ICTALAS30.DLL ,DATA文件夹,Configure.xm l放在同一个目录下即可。
模块化设计如下:
#coding:gb2312
from ctypes import *
import re
class ictclas:
def __init__(self):
self.dll=cdll.LoadLibrary("ICTCLAS30.dll")
self.dll.ICTCLAS_Init(c_char_p("."))
def exit(self):
self.dll.ICTCLAS_Exit()
def addDict(self,dictpath):
self.dll.ICTCLAS_ImportUserDict(c_char_p(dictpath));
self.dll.ICTCLAS_SaveTheUsrDic()
def procss(self,text):
bSuccess=self.dll.ICTCLAS_ParagraphProcess(c_char_p(text), 1)
return c_char_p(bSuccess).value
if __name__=="__main__":
fenci=ictclas()
#fenci.addDict('d://pku-words.txt')
print fenci.procss('亚太经合组织欢迎你')
fenci.exit()
分享到:
相关推荐
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,在此就不多作介绍了。这是该软件的2015版本,欢迎各位学者下载使用。
采用Java实现分词系统,包括去除停用词,文本处理完毕后输出到txt
为此,中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;...
带分词词性分类,VS2008项目,可以直接运行Demo程序,效果棒棒哒!
中科院分词(ICTCLAS30.dll),去除时间限制破解版。 只是包含DLL文件,不含其他文件。
ICTCLAS 中文分词 中科院 ICTCLAS 中文分词 中科院
最好的中文分词算法,新鲜出炉,不过里面的文件是2014的
实现了用java调用中科院分词工具。可用于软件或者web工程。
中关村开发的中文分词系统,版本为当前最新,支持32位操作系统
ik分词和ictclas分词两者结合,可使得分词结果更加精准。
计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll,COM组件和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,...
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;...
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;...
最好的中分分词工具ictclas 最好的中分分词工具ictclas 最好的中分分词工具ictclas
北京师范大学的陈天在ICTCLAS的基础上开发的Java分词系统。 本软件的著作权归版权所有人所有,这里只是提供科学研究使用。
中文分词标注软件,开源版ICTCLAS,C++环境,用用还不错。
ICTCLAS中文分词系统C++代码,内容很强大,很好。ICTCLAS中文分词系统是目前世界最好的分词系统
java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典...
中科院ICTCLAS2014分词系统下载包