- 浏览: 160688 次
最新评论
-
px_dn:
灰常感谢!!!!
转 Lucene中文分词组件 JE-Analysis 1.5.1 天狼 -
infinite:
转了你就不能注明一下出处?
转 Lucene中文分词组件 JE-Analysis 1.5.1 天狼 -
fxbird:
不过是翻译了下文档,没意义。在topic里要写什么东西?
OSCache文档-3.3在集群系统中使用OSCache -
chq32:
同问,tomcat集群下,oscache的异常如何解决
OSCache文档-3.3在集群系统中使用OSCache -
czwangelo:
]
转 Lucene中文分词组件 JE-Analysis 1.5.1 天狼
相关推荐
VSM向量空间模型(Vector Space Model)是一种常用的文本表示方法,由Salton等人于20世纪70年代提出。该模型将文本内容处理简化为向量空间中的向量运算,并以空间上的相似度表达语义的相似度。 在VSM模型中,文本被...
3.提出了一种基于句子向量空间模型的案例知识表示方法,把案例知识表示的粒度从词或术语提升到句子,支持基于语义和领域知识的案例检索; 4.使用文本聚类方法,实现案例知识的自动聚类,对案例知识加以抽象,提高...
基于C++实现的自适应文本检索系统源码+项目运行说明+数据(课程大作业).zip 此次作业完成了任务:“每一次检索后对返回的文档执行相关反馈的判断,重新生成查询”。项目全部使用C++语言,并且独自从零开始编写。代码...
基于Milvus+ERNIE+SimCSE+IBN的学术文献语义检索系统(码...通过使用最先进的语义索引模型找到文本的向量表示,在高维向量空间中对它们进行索引,并度量查询向量与索引文档的相似程度,从而解决了关键词索引带来的缺陷。
2020-2021春季XMU信息检索大作业:自适应文本检索系统的实现 initialize.cpp 用于初始化服务器,即构造向量空间模型。这里包括: 获取全部文档的绝对路径,并将文档与一个数字编号一一映射; 读取全部文档,并将...
这是一个基于C#的反作弊系统,基于VSM空间向量模型,能对doc和txt文件进行相似度的检测,在VS2005和SQL Server 2005上实现
所谓语义检索(也称基于向量的检索),是指检索系统不再...通过使用最先进的语义索引模型找到文本的向量表示,在高维向量空间中对它们进行索引,并度量查询向量与索引文档的相似程度,从而解决了关键词索引带来的缺陷。
在系统中使用向量空间模型将问题句子映射为一个向量a(x1,x2,x3,…,xn),将目标句子映射为另一个向量b(y1,y2,y3,…,yn),如图1所示。计算其对应向量之间的夹角余弦: Sim(a,b)=cos(θ)= (x*y) / (||a|| * ||b||) ...
将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度。所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统...
提出了一种利用权值调整思想对向量空间法(VSM)和朴素 Bayes分类器(NBC)进行改进的文本分类方法,并探讨了利用 EM算法进行无导师 Bayes分类的方法,设计和实现了一个中英文文本分类系统 CZW。3组实验数据表明,用某些...
向量空间模型 语言模型 概率模型 有关这些模型的更多信息(无双关语!),请参阅 Google 使用 PageRank 算法来利用 html 文档中的超链接。 此包目前仅适用于文本文档的语料库。 我还希望添加 html/xml 支持,并...
向量空间模型 4.5 检索效果评价 召回率和精确率 召回率-精确率曲线 TREC项目 208 万维网搜索(World Wide Web Searching) 其他有效性评价方法 4.6 余弦法实现 文档内频率 余弦值的计算方法 文档权重所需的内存 累加...
基于数据挖掘模型的高压输电线系统故障诊断.caj 基于数据挖掘的地下硐室围岩稳定性判别.caj 基于数据挖掘的普通话韵律规则学习.caj 基于数据挖掘的智能化入侵检测系统.caj 基于数据挖掘的深部采场岩爆知识的自动获取...
基于数据挖掘模型的高压输电线系统故障诊断.caj 基于数据挖掘的地下硐室围岩稳定性判别.caj 基于数据挖掘的普通话韵律规则学习.caj 基于数据挖掘的智能化入侵检测系统.caj 基于数据挖掘的深部采场岩爆知识的自动获取...
基于数据挖掘模型的高压输电线系统故障诊断.caj 基于数据挖掘的地下硐室围岩稳定性判别.caj 基于数据挖掘的普通话韵律规则学习.caj 基于数据挖掘的智能化入侵检测系统.caj 基于数据挖掘的深部采场岩爆知识的自动获取...
基于信息熵的地学空间数据挖掘模型.caj 数据挖掘及其在商业银行中的应用.caj 数据挖掘与决策支持系统.caj 数据仓库、数据集市和数据挖掘.caj 数据仓库与数据挖掘1.caj IDSS 中数据仓库和数据挖掘的研究与实现.caj ...
向量空间模型 202 4.5 检索效果评价 205 召回率和精确率 205 召回率-精确率曲线 207 TREC项目 208 万维网搜索(World Wide Web Searching) 212 其他有效性评价方法 215 4.6 余弦法实现 216 文档内频率 217 ...
同时在现有的词向量和位置向量作为网络输入的基础上,进一步引入依存句法特征和相对核心谓词依赖特征,其中依存句法特征包括当前词的依存关系值和所依赖的父节点位置,从而使模型进一步获取更多的文本句法信息....
Pattern:包括词性标注工具,N元搜索,情感分析,WordNet,支持机器学习的向量空间模型,聚类,向量机。 TextBlob:提供了一些简单的api,例如词性标注、名词短语抽取、情感分析、分类、翻译等等。 Gensim:提供了对...
检索:实现向量空间模型和流行的 Okapi BM25 排名模型的变体,用于搜索。 该搜索引擎已在克兰菲尔德集合上进行了测试。 克兰菲尔德收藏。 这是允许精确定量测量信息检索有效性的开创性测试集,但如今除了最基本的...