`
企鹅木白
  • 浏览: 32891 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

哈工大NLP处理工具pyltp安装历程

阅读更多
   这个pyltp的安装可谓艰辛,pyltp是哈工大的自然语言处理包,用于分词,词性标注,依存句法分析等工作,是目前国内最好的解析器之一。
   但是其分词等方法和模型是由C++代码编写,所以使用python调用的时候需要有VC库,也就是需要下载Visio studio,版本在2008以上,然而pyltp的版本以及之后需要下载的分词等模型版本,以及VS版本,都要一致。
   本人下载的是目前最新pyltp版本1.9版本,使用pip下载即可,之前必须安装vs,我从2008版本还是试起,直到2015版本才下载成功,不然会报错:cant find vcvarcall.bat,这个在路径C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC下。有时候下载完后没有自动添加,需要手动添加环境变量。下载成功后,开始下载ltp_data模型文件。地址https://pan.baidu.com/share/link?shareid=1988562907&uk=2738088569#list/path=%2F(下载完毕后放置目录随意,使用的时候是需要手动指定目录的),0.1.9版本必须匹配3.4版本的模型,不然会报错:与C++签名不符合。
    现在pyltp就安装成功了,输入测试代码

# -*- coding: utf-8 -*-
from pyltp import SentenceSplitter
def sentence_splitter(sentence='这是一句测试分句的代码'):
    sents = SentenceSplitter.split(sentence) 
    print '\n'.join(sents)
#测试分句子
sentence_splitter()

成功~~
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics