- 浏览: 154615 次
- 性别:
- 来自: 上海
最新评论
-
1285132895:
能讲的具体一点吗?或者提供一点资料也行啊
Apache Tika 文件内容提取工具 -
shuyanbo:
想法很好。网站停掉了?好像不能访问。
为什么要搭论坛 -
mistbow:
论坛进不去了。。。。
目前我感兴趣的,希望有同好,一起学习 -
柏瑞克李:
我觉得lucene的打分 更多的依赖于 query parse ...
我为什么没有用lucene的score来排序 -
alexzhan:
因为在greader上订阅了你的博客。所以看到了你的文章。
2010-8-3扯淡
相关推荐
针对这一问题,提出了融合句子情感和主题相似性的中文新闻文本情感摘要。首先,对文本中的句子进行情感标注;然后,在LexRank算法中加入情感信息计算句子相似度;最后,根据新闻标题的特殊性计算句子与标题的相似性...
1.本项目基于jieba的中文分词库提取新闻中的...新闻相似度是本项目进行推荐的基础,使用新闻主题词的重合度考量新闻相似度;统计指定标签下的新闻是为用户选择标签后生成“为你推荐”模块内容做准备。 4.项目博客: ...
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-...
# 使用词嵌入计算文本相似性 ## 简介 - 利用词嵌入实现文本之间的相似性计算等操作。 ## 词嵌入 - 在自然语言处理中,对字符的研究往往没有对单词的研究来的有意义,因为在自然语言中语义的基本单位是词而不是字(绝...
不平等的在线新闻报道 目标: 这是SOCI 40133计算内容分析的课程项目。... 网络分析:考虑到新闻本身可能会产生偏差,我将使用网络分析来了解新闻来源之间新闻主题的差异。 数据源: 讲师提供的网络语料库新闻 参考:
在本文中,我们总结了微博客和短消息新闻之间的相似性,然后提出了一种基于5W(何时,何地,谁,什么,如何)模型的5WTAG算法,用于检测微博客主题。 由于5W属性是事件描述中的核心组件,因此从理论上保证5WTAG可以...
文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。...
根据兴趣和兴趣主题为读者建议新闻标题 方法 为了解决这个问题,我将根据数据集构建一个嵌入模型,以不同地显示数据集上可用标题之间的相似性,然后将其馈入Kmeans算法(无监督学习)中以创建可用于建模的聚类。 ...
5.2、02信息增益的计算、模型评估、ID3、C4.5、CART_ 5.3、03决策树案例分析1 5.4、04决策树案例分析二、过拟合、剪枝分析 5.5、05bagging、随机森林、随机森林案例分析 5.6、06GBDT、Adaboost原理讲解 5.7、07...
这个项目控制了给DRAM参数使用之DRAM频率的数值。同理,数值小性能高,但是对内存的质量也要求严格! DRAM RAS# to CAS# Delay: 这个项目可控制DRAM作用指令与读取/写入指令之间的延迟时间,有2,3,4几种选择。...
本书系编程语言先驱者Ivor Horton的经典之作,是学习C++编程最畅销的图书品种之一,不仅涵盖了Visual C++ .NET编程知识,还全面介绍了标准C++语言和.NET C++/CLI。本书延续了Ivor Horton讲解编程语言的独特方法,...
历史上的 Linux就是这么产生的,Linus Torvalds当时是一名赫尔辛基大学计算机科学系的二年级学生,经常要用自己的电脑去访问大学主机上的新闻组和邮件,为了方便读写和下载文件,他自己编写了磁盘驱动程序和文件...
历史上的 Linux就是这么产生的,Linus Torvalds当时是一名赫尔辛基大学计算机科学系的二年级学生,经常要用自己的电脑去访问大学主机上的新闻组和邮件,为了方便读写和下载文件,他自己编写了磁盘驱动程序和文件...