`
phantom
  • 浏览: 160273 次
社区版块
存档分类
最新评论
文章列表
http://phantom.iteye.com/ 我的新blog
基于向量空间模型的文本检索系统 ... 自动经验学习 自动分类...  
基于关键短语的文本分类研究  刘华 (暨南大学 华文学院/海外华语研究中心,广州 510610)摘  要: 文本分类的进一步改进不在算法方面,应该立足于影响文本分类最底层、最根本的因素:文本表示中的特征项,提高特征项的完整独立程度。关键短语是具有强文本表示功能的特征短语,在表示文本时,能将文本的内容特征(如主题类别)鲜明地表示出来。关键短语具有结构稳定、语义完整和强统计意义的特点,能克服向量空间模型和贝叶斯假设的缺点,更适合作为文本表示的特征,有利于提高文本分类的效果。本文从语言学、认知心理学和言语习得、计算语言学等方面寻求关键短语优势的理论依据,对关键短语进行了界定,通过抽取网页上专家标引的关 ...
 数学与应用数学专业  培养目标:本专业培养掌握数学的基本理论和数学应用的基本方法,受到科学研究的初步训练,能在数学及其相关领域从事科研、教学工作的高级人才。   主要课程:数学分析、高等代数、概率论与 ...
自适应的并行关系存储方式选择算法及在线转换技术  
你知道google和百度两个关键词的相关度是多少么?--最后我将来回答这个问题 通常我们对于文本信息之间得相关性得计算都是采用向量的办法,我在以前的PPT里曾经提到过。然而对于文本信息更深层次的分析不能单纯从字面上 ...
Google (谷歌)中国的博客网志,走近我们的产品、技术和文化 数学之美 系列 12 - 余弦定理和新闻的分类2006年7月20日 上午 10:12:00 发表者:吴军,Google 研究员 余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有 ...
2006-05-29 17:40     主题:  【发布】Lucene中文分词组件 JE-Analysis 1.5.1   天狼   注册于: 2006-05-28 00:23 帖子总数: 103 离线  本站申明: 该组件免费安装使用传播,无限制商业应用,但暂不开源,也不提供任何保证 分词效率: ...
locale=utf-8default_encoding=utf-8 number_format=# date_format=yyyy-MM-dd time_format=HH:mm:Ss datetime_format=yyyy-MM-dd HH:mm:Ss
http://maomao.blog.51cto.com/
WebWork深入浅出 2006-11-21 14:48:46: 作者: 钱安川 来源: 开源大本营  标签:webwork mvc framework 文章转载自互联网,如果您觉得我们侵权了,请联系管理员,我们会立刻处理。 前言 本篇文章并没有太多WebWork 的实战代码细节。本人 ...
[转] 在Hibernate中使用分布式 OSCache   在Hibernate中使用分布式 OSCache 在Hibernate中使用分布式 OSCache          润名,Monday, Twenty-eighth March 2006       为了减少与数据库通信来提高应用的性能,我们在Hibernate中使用了分布式缓存:OSCache。        Oscache是得到了广泛使用的开源 Cache 实现(Hibernate中对它提供了支持),它基于更加可靠高效的设计,最重要的是,新版本的OSCache已经支持集群分布式。如果系统需要在部署在集群中,或者 ...
OSCache 2.0有个新特性是对集群缓存的支持.OSCache当前是搭载实现的,它允许你使用JavaGroups或JMS作为底层的广播协议. 跨集群机缓存仅在数据涌流发生事件发生时才广播消息。也就是是说,服务器缓存内容是相互独立的,但是无论何时一台服务器中内容成旧后,其它的也会认为是成旧的。因为我们不必将缓存的对象传到周边的集群机,所以它提供给我们一个很好的解决方案,再加上在集群系统中没有中心机来控制集群系统,故及群系统的鲁棒性非常好。 对一个集群系统配置OSCache非常简单。根据你选择的协议(JavaGroups或JMS)按照下面对应的操作进行即可完成配置. JMS的配置 配置你的 ...
在上部分的介绍中,已经可以直接使用Jchannel构建一个简单的组通信,接下来将介绍一些在编程中比较常用的类和接口。    一、基本接口:以下类位于org.jgroups包下    1)MessageListener:消息监听器 以下内容为程序代码:public interface MessageListener {   void receive(Message msg);   byte[] getState();   void setState(byte[] state);}    2)ExtendedMessageListener:扩展消息监听器 以下内容为程序代 ...
  JavaGroups—构建分布式通信的基础(上)    JavaGroups 是一种可靠组通信工具,在同一个台主机、局域网甚至是广域网中,组成员可以加入一个组,发送消息给其它的组成员并从其它成员中接收消息,系统跟踪所有组成员 ...
Global site tag (gtag.js) - Google Analytics