1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。
2. 将下载后的 php_scws.dll 放到 php 安装目录的
extensions/ 目录中去(通常为:X:/php/extensions/或 X:/php/ext/)。
3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc
4. 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中
词典系列:http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2
http://www.ftphp.com/scws/down/scws-dict-chs-utf8.tar.bz2
http://www.ftphp.com/scws/down/scws-dict-cht-utf8.tar.bz2
4. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,
在 php.ini 的末尾加入以下几行:
[scws]
;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 php_scws.dll 指定为绝对路径。
;
extension = php_scws.dll
scws.default.charset = gbk
scws.default.fpath = "c:/program files/scws/etc"
5. 重开 web 服务器即可完成。
- <?php
- //使用类方法分词
- $so=scws_new();
- $so->set_charset('gbk');
- //这里没有调用set_dict和set_rule系统会自动试调用ini中指定路径下的词典和规则文件
- $so->send_text("我是一个中国人,我会C++语言,我也有很多T恤衣服");
- while($tmp=$so->get_result()){
- print_r($tmp);
- }
- $so->close();
- //使用函数提取高频词
- $sh=scws_open();
- scws_set_charset($sh,'gbk');
- scws_set_dict($sh,'/path/to/dict.xdb');
- scws_set_rule($sh,'/path/to/rules.ini');
- $text="我是一个中国人,我会C++语言,我也有很多T恤衣服";
- scws_send_text($sh,$text);
- $top=scws_get_tops($sh,5);
- print_r($top);
- ?>
更多参考hightman论坛
- <?php
- require("splitword.php");//包含分词类文件
- $SpWord=newSplitWord();//创建类对象
- $str="某某字符串";
- $words=$SpWord->SplitRMM($str);//调用类方法
- $SpWord=iconv("gbk","utf-8//ignore",$SpWord);
- $SplitWord->Clear();
相关推荐
thinkphp3.2搭配scws实现中文分词,自行改一下tp5.0应该也是可以用的
scws是 基于词频词典的中文分词系统,源码包中含有win下php的dll拓展.测试可用
简介 SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。
中文分词系统,PHP分词的上乘之选
scms 中文分词器,使用c实现,可以在linux环境下使用,分词的速度非常的快,可以用于一般的分词程序
主要介绍了php实现scws中文分词搜索的方法,详细介绍了scws中文分词搜索的具体步骤与相关使用技巧,并提供了scws的本站下载地址,需要的朋友可以参考下
scws,中文分词,开源,机械分词法,简单分词
它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间 用空格分开,所以如何准确快速的分词一直是中文分词的...
它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词之间 用空格分开,所以如何准确快速的分词一直是中文分词的...
SCWS简易中文分词系统.zip
PHP中文分词扩展 SCWS,可以在windows7下vs2012中编译出来的,支持php5.6.x zts版
SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时...
LAMP下scws插件安装,myft插件
SCWS简易分词PHP扩展模块,现测试在PHP5.3.8通过, 环境为IIS7+FastCGI nts PHP5.3.8 其他PHP5.3.X 理论上应该可用。 该模块为SCWS官方提供的SCWS-1.1.8源码进行编译。 因为官方没有提供 对应的非线程模块。
Laravel开发-scws 简单中文分词系统在Laravel的密封包装。
基于PHP的SCWS 开源免费的简易php中文分词系统.zip
基于PHP的SCWS开源免费的简易php中文分词系统源码.zip