ubuntu下pycharm调用Hanlp实践分享
前几天看了大快的举办的大数据论坛峰会的现场直播,惊喜的是hanlp2.0版本发布。Hanlp2.0版本将会支持任意多的语种,感觉还是挺好的!不过更多关于hanlp2.0的信息,可能还需要过一段时间才能看到,只能等一下了!下面分享一篇大神的文章,是关于在ubuntu下使用pycharm调用hanlp的实验。
以下为全文:
首先点击File,选择Settings,在Project 下点击Project Interpreter,并通过点击右边的加号:
搜索JPype,根据python版本选择你需要的JPype版本安装。
之后,在https://github.com/hankcs/HanLP/releases
网站下载hanlp.jar包、模型data包、配置文件hanlp.properties,新建一个文件夹Hanlp,
把hanlp.jar和hanlp.properties放进去;之后需要再新建一个文件夹hanlp,并将data放进去;
修改Hanlp下的路径为当前data的路径,由于我将data放在/home/javawork/hanlp下,因此:root=/home/javawork/hanlp/
接下来新建一个文件demo_hanlp.py,代码如下:
#! /usr/bin/env python2.7
#coding=utf-8
from jpype import *
# startJVM(getDefaultJVMPath(), "-Djava.class.path=home/javawork/Hanlp/hanlp-1.2.7.jar;home/javawork/Hanlp/", "-Xms1g", "-Xmx1g")
startJVM(getDefaultJVMPath(), "-Djava.class.path=/home/qinghua/javawork/Hanlp/hanlp-1.2.7.jar:/home/qinghua/javawork/Hanlp")
HanLP = JClass('com.hankcs.hanlp.HanLP')
# 中文分词
print(HanLP.segment('你好,欢迎在Python中调用HanLP的API'))
testCases = [
"商品和服务",
"结婚的和尚未结婚的确实在干扰分词啊",
"买水果然后来世博园最后去世博会"]
for sentence in testCases: print(HanLP.segment(sentence))
# 命名实体识别与词性标注
NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')
print(NLPTokenizer.segment('中国科学院计算技术研究所的宗成庆教授正在教授自然语言处理课程'))
# 关键词提取
document = "水利部水资源司司长陈明忠9月29日在guo wu yuan新闻办举行的新闻发布会上透露," \
"根据刚刚完成了水资源管理制度的考核,有部分省接近了红线的指标," \
"有部分省超过红线的指标。对一些超过红线的地方,陈明忠表示,对一些取用水项目进行区域的限批," \
"严格地进行水资源论证和取水许可的批准。"
print(HanLP.extractKeyword(document, 2))
# 自动摘要
print(HanLP.extractSummary(document, 3))
# 依存句法分析
print(HanLP.parseDependency("徐先生还具体帮助他确定了把画雄鹰、松鼠和麻雀作为主攻目标。"))
shutdownJVM()
需要注意的是ubuntu的路径分割符为”:”,而window 为” ; ”
另附hanlp调用常见问题集:
github.com/hankcs/HanLP/issues?page=3&q=is%3Aissue+is%3Aopen
作者:imperfect00
相关推荐
java-11.0.7-jetbrain https://blog.csdn.net/qq_40366038/article/details/116094370
Ubuntu桌面pycharm开发的docker-compose文件,包括磁盘映射、分辨率配置、端口映射和网络配置!
直接将三个文件复制到/opt/pycharm-2016.3.1/bin目录下即可
pycharm工程python调用OpenCV实现USB摄像头实时人脸检测,统计每帧人脸检测消耗的时间,并实时保存人脸截图
深度学习安装篇之二:ubuntu+pycharm安装.odt
1. PyCharm, IDE有个Project setting图标,是给run图标做配置的,配置run file为myfile.py2.复制代码 代码如下:# ————————————–#! /usr/bin/python# File: myfile.py# Author: Michael Fan from make....
由于 Ubuntu 中的汉字输入实在是太不友好了,所以装了个 搜狗输入法,好不容易把 搜狗输入法装好,本以为可以开开心心的搞代码了,然而。。。 pycharm 一打开,就崩溃,关不掉,进程杀死还是不行,只能关机重启。 ...
本篇文章主要介绍了Ubuntu 16.04 pycharm设置桌面快捷启动方式,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
Ubuntu 中 pycharm 汉化-附件资源
下面小编就为大家分享一篇Ubuntu下pycharm无法导入类的解决方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
今天小编就为大家分享一篇浅谈Pycharm调用同级目录下的py脚本bug,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
pyCharm工程pyQt5利用OpenCV3调用本地摄像头、使用了QTimer定时器触发实时显示摄像头视频帧。
主要介绍了解决Ubuntu18中的pycharm不能调用tensorflow-gpu的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
cd到该文件夹的bin下 cd Downloads/pycharm-community-2018.1.4/bin(或进文件夹打开终端) 执行sh命令,打开安装:sh ./pycharm.sh 稍等一会安装完成,弹窗,这里根据自己状况选择,首次安装选第二个就好。 再...
Ubuntu 18.04 安装 PyCharm.rar
一、ubuntu安装mysql 首先查看是否安装过MySQL sudo netstat -tap|grep mysql 安装 ...apt-get update 更新...二、Ubuntu安装pycharm 下载 去官网http://www.jetbrains.com/pycharm/download/#section=linux,, 下
主要为大家详细介绍了Ubuntu下Anaconda和Pycharm配置方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下