-----
4.1 安装:
mmseg 如果出错
aclocal
libtoolize --force 我运行后有一个错误,没管它。
automake --add-missing
autoconf
autoheader
make clean
./configure --prefix=/usr/local/mmseg3
sphinx如下
cd csft-4.1
sh buildconf.sh
...
------------------------------------
看文档:http://www.coreseek.cn/docs/coreseek_3.2-sphinx_0.9.9.html#ref-indexer
使用实例
http://bbs.linuxtone.org/thread-7595-1-1.html
php
多个索引,php 端 用$sphinx->query('关键字', '索引1,索引2');
索引1,2 顺序是有意义的,权值和属性值 后面的高于前面的
【搜索多个关键词】,
尝试 批量查询 Addquery + RunQueries, 注意 前面的setFilters会被后面使用,所以要清除: ResetFilters,排序等也一样。
另一种:
设置匹配模式为 SPH_MATCH_BOOLEAN,然后用 | 分隔,我直接用 | 不加 () 不好使,用了() 和 | 配合才行,
$keyword = "(蝴蝶男)|(混蛋)";
$sphinx->SetMatchMode(SPH_MATCH_BOOLEAN);
默认 只出来20个结果,这里自定义一下
$sphinx->setLimits($offset,$length,$length);
----------------
一元分词 要配合着 独立的中文分词才有效果
不用一元分词:
#以下部分为中文分词核心配置 #stopwords = /path/to/stowords.txt的位置 charset_dictpath = /usr/local/mmseg3/etc/ charset_type = zh_cn.utf-8 #charset_table = .................... #需将原有 的该配置注释掉 ngram_len = 0 #以上部分为中文分词核心配置
还能配置mmseg产生这个效果,搜“张三丰”,含 太极宗师,武当宗师的也能搜出来
张三丰 -太极宗师,武当祖师,
-------------------
http://www.9enjoy.com/post/436/
第1,把增量索引存到共享内存中
第2,主索引和增量索引没有通过sph_counter表来记录主索引到达的ID,而是使用时间戳来判定,很适用于论坛的贴子索引。
第 3,只需要Query($query,"main,delta"),就可以让程序搜索主索引+增量索引了。
服务器
更新索引的时候 加 --rotate ,不影响spginx搜索的正常使用
平滑重启 参数 SIGTERM
-----------------------------------------------------
索引:/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all
更新索引:/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/sphinx.conf --all --rotate(可以定时每天更新一次)
搜索服务启动:/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf
搜索服务关闭:/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/sphinx.conf --stop
搜索测试:/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/sphinx.conf -a 王
参考:
安装:http://www.coreseek.cn/products-install/install_on_bsd_linux/
PHP+MySQL使用Sphinx:http://www.coreseek.cn/products-install/step_by_step/
一元分词配置:http://www.coreseek.cn/products-install/ngram_len_cjk/
API:http://www.coreseek.cn/products-install/api-list/
参考
http://www.coreseek.cn/products-install/step_by_step/
http://docs.php.net/manual/zh/book.sphinx.php
相关推荐
8、总结与问题 总的来讲,训练时只需要提供语料文件和录音文件,形式上比较简单,但要给一个好的语料文件还需要不断试验。 上面的步骤和脚本都是根据sphinx的文档来的。需要注意的是,版本不同,内容可能也会不同。...
sphinx系统是一个拥有悠久历史的语音识别系统,李开复自称第一个sphinx是他写的。 传说 中是第一个实用的10数字语音系统。 是由卡奈基.美隆大学研发。 sphinx3.x是基于C语言的最新版本,sphinx和 sphinx2请大家...
Sphinx JAVA接口 Sphinx JAVAAPI
node-pocketsphinx, node.js的Pocketsphinx绑定 用于 Node.js的 PocketSphinx这里 MODULE 旨在通过使用PocketSphinx在便携设备上实现基本语音识别。安装Windows 安装尚不支持。要构建这里 MODULE,你需要具有以下...
Sphinx overview Sphinx is an open-source full-text search server, designed from the ground up with performance, relevance (aka search quality), and integration simplicity in mind. Sphinx lets you ...
Sphinx-完整中文手册 Sphinx-完整中文手册 Sphinx-完整中文手册
Sphinx中文手册 sphinx的安装与使用技巧
sphinx4需要使用连续的声学模型,官网上下载下来的中文声学模型全是半连续的,这里提供能够在sphinx4中使用的中文声学模型
php7中sphinx扩展,包含coreseek源码,用于安装libsphinxclient来解决libsphinxclient报错问题。
sphinx资源安装包
Coreseek 全文检索服务器 2.0 (Sphinx 0.9.8)参考手册和源程序 手册內容: 文档版本:v0.9 目录 1. 简介 1.1. 什么是 Sphinx 1.2. Sphinx 的特性 1.3. 如何获得 Sphinx 1.4. 许可协议 1.5. 作者和贡献者 1.6. ...
全文检索sphinx支持discuz包,好东西,请大家下载
sphinx Linux 中文分词
Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。 特性: 100% 纯 JavaScript API, 可通过 Web Workers 录制 支持 PocketSphinx 所...
sphinx 1.3.4 .
sphinx-gui, 用于编辑Sphinx文档的桌面界面 Pre alpha sphinx用于查看和编辑ReStructuredText中的Sphinx文档的桌面 GUI 。 用 PySide ( http://www.pyside.org ) 制作。 文档http://sphinx-gui.rtfd.
sphinx的Linux安装包
cmu sphinx语音识别,中文语音包,官网下载重新打的zip包
pocketsphinx在windows下的中文语音识别 http://blog.csdn.net/itas109/article/details/78999477
alabaster, 轻量级,可以配置的Sphinx主题现在,Sphinx默认 ! Alabaster?雪花是一个可视化的( c ) 精简,响应性,可以配置的主题,用于 Sphinx的文档系统。 兼容 python 2 3兼容。它作为第三方主题开始,仍然独立...