安装在ubuntu9.10上:
cd /usr/local
sudo wget http://httpcws.googlecode.com/files/httpcws-1.0.0-i386-bin.tar.gz
sudo su
tar zxvf httpcws-1.0.0-i386-bin.tar.gz
cd httpcws-1.0.0-i386-bin
ulimit -SHn 65535
/usr/local/httpcws-1.0.0-i386-bin/httpcws -d -x /usr/local/httpcws-1.0.0-i386-bin/dict/ -p 2009
测试效果:
#!/usr/bin/env python
# encoding: utf-8
import urllib
def main():
title = u'基于HTTP协议的开源中文分词系统'.encode('gbk','replace')
data = urllib.urlencode({'w':title})
url = 'http://192.168.15.50:2009/?%s'%data
body = urllib.urlopen(url)
print body.read().decode('gbk','replace')
if __name__ == '__main__':
main()
输出结果:基于 HTTP 协议 的 开源 中文 分词 系统
分享到:
相关推荐
工具查询开源中文分词系统 HTTPCWS 1.0.0 PHP演示程序-httpcws-php-demo.zip
基于HTTP协议的开源中文分词系统,64位 详细请见http://blog.s135.com/httpcws_v100/3/1/
基于HTTP协议的开源中文分词系统,php演示 详细请见http://blog.s135.com/httpcws_v100/3/1/
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...
基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容管理系统.zip基于Java的开源内容...
原生IK中文分词是从文件系统中读取词典,es-ik本身可扩展成从不同的源读取词典。目前提供从sqlite3数据库中读取。es-ik-plugin-sqlite3使用方法: 1. 在elasticsearch.yml中设置你的sqlite3词典的位置:ik_analysis...
基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理系统项目源码.zip基于Java开源内容管理...
基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java开发的开源内容管理系统源码.zip基于Java...
开源免费的简易中文分词系统,PHP分词的上乘之选
基于PHP的SCWS 开源免费的简易php中文分词系统.zip
盘古分词-开源中文分词组件词典PanGu_ReleaseV1.1.0.1
基于PHP的SCWS开源免费的简易php中文分词系统源码.zip
Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了...
java开源分词系统主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展用户可以动态增加、删除用户词典...
用纯C语言开发了一个中文分词系统,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例) 用法很简单,比如:你把中文分词系统解压后保存到D:\那你直接在 dos 窗口下输入: d:\cfenci.exe 然后回车...
带分词词性分类,VS2008项目,可以直接运行Demo程序,效果棒棒哒!
这是一个基于深度学习的分词系统和语料项目。背景97.5%准确率的深度学习中文分词(字嵌入 Bi-LSTM CRF)构建安装好bazel代码构建工具,clone下来tensorflow项目代码,配置好(./configure)clone 本项目地址到...