`
ipython
  • 浏览: 289155 次
  • 性别: Icon_minigender_1
  • 来自: 佛山
社区版块
存档分类
最新评论

python 中文分词 (windows) pymmseg

阅读更多

pymmseg windows下中文分词, 下载附件, 直接 import 目录就行了。

 

 

 

#coding=utf-8

 

from pymmseg import mmseg   

mmseg.dict_load_defaults()    

text = '今天的天气真好啊,我们一起出去玩一下吧'

algor = mmseg.Algorithm(text)    

word  = []

for tok in algor:    

    word.append(tok.text)

 

print ' '.join(word).decode('utf8').encode('gb2312')

 

 

 

命令行cmd下的效果:

 

G:\git\Graduation-Design\src\web>aa.py

今天 的 天气真好 啊 , 我们 一起 出去 玩 一下 吧

 

====================================

之前下载了一个 inpout32.dll 文件放到了 c:/windows/system32/目录, 不知这是不是必须的。

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics