- 浏览: 50305 次
- 性别:
- 来自: 湖南
最新评论
什么是规则?就是一个条件和一个结果的和:If condition then result。实际中有用的往往是结果中只有一个元素的情况。
关联规则(association rule)挖掘技术用于发现数据库中属性之间的有趣联系。和传统的产生式规则不同,关联规则可以有一个或多个输出,同时一个规则的输出属性可以是另一个规则的输入属性。关联规则分析有时也叫购物篮分析,是因为它可以找寻出潜在的令人感兴趣的所有的产品组合。由此,有限数目的属性可能生成上百条规则。
关联规则的置信度、支持度和兴趣度:
元组 |
出现频率 |
A |
45% |
B |
42.5% |
C |
40% |
A和B |
25% |
A和C |
20% |
B和C |
15% |
A和B和C |
5% |
支持度:就是一个元组在整个数据库中出现的概率。如上面的例子中S(A)=0.45。
置信度:它是针对规则而言的。对于一般的规则,它的可信度=p(condition and result)/p(condition)。例如有如下规则:If B and C then A。则它的置信度是:p(B and C and A)/p(B and C)=5%/15%=0.33。
提高率(或者叫兴趣度):对于上面的一个规则,我们可以发现,当我们从从数据库中直接取A的时候,概率是45%;可在我们的规则中,取到A的概率却只有33.3%。显然,这种情况是我们不愿意见到的,我们应该略去这样的一些规则。所以我们引入了兴趣度的概念,具体的公式如下:兴趣度=p(condition and result)/p(condition)*p(result)。当兴趣度大于1的时候,这条规则就是比较好的;当兴趣度小于1的时候,这条规则就是没有很大意义的。兴趣度越大,规则的实际意义就越好。
克服实际应用中数据量暴大的问题。当数据量增大时,要考虑的元素组就增长的很快了。
关联规则的优缺点:
优点:
·它可以产生清晰有用的结果。
·它支持间接数据挖掘。
·可以处理变长的数据。
·它的计算的消耗量是可以预见的。
缺点:
·当问题变大时,计算量增长得厉害。
·难以决定正确的数据。
·容易忽略稀有的数据。
发表评论
-
项目开发日志杂记
2009-05-04 13:05 925开发日志 0:32 2008-9-18 1、中文 ... -
笔记本维护故障一则
2007-03-18 23:40 671唉呀,今天真的是羞死 ... -
多Web服务器的80端口访问
2007-03-23 11:42 1416写这篇文章,源自于自己的一个需求。这几天一校园WEB站点因为域 ... -
[转]Windows系统文件详细解说
2007-04-02 23:38 579详细的介绍了WINDOWS系统文件的用途,我想各位保存一份以后 ... -
关于Windows文件共享服务的一些问题
2007-04-02 23:44 2475[问题引出]:我刚安装windows2003时,Compute ... -
MS Project 2003的一个问题
2007-04-03 18:04 1000[问题引出]:刚装完MS Project 2003,一运行就出 ... -
IBM xSeries服务器安装内存一则
2007-04-04 00:55 769部门进购IBM xSeries 225服务器已经达三年之久了, ... -
JAVA与蓝牙起步(Getting Started with Java and Bluetooth)
2007-04-26 00:39 1464栈初始化在你做任何事之前,你需要初始化你的栈。记住,栈是一个用 ... -
Windows 2000下的远程桌面工具
2007-04-28 18:10 967在Windows XP之后的系统中都会在“系统”属性中可以设置 ... -
最近在看的书
2007-06-25 03:17 6111、JSP网络开发技术与整合应用 ... -
想看的书---<<开发自己的搜索引擎---Lucene 2.0 + Heritrix>>
2007-06-26 21:47 1687开发自己的搜索引擎---Lucene 2.0 + Heritr ... -
不要用浏览器来测试
2007-07-03 11:02 884进行B/S系统编程,大概浏览器就是最直接的测试程序是否正确的方 ... -
Big-Endian And Little-Endian
2007-07-07 11:32 821今天老师给我们复习单片机,出了一个题目,就这个字节存储顺序搞得 ... -
MySQL的中文问题
2007-07-08 21:12 690唉,看到网上这么多的关于MySQL中文编码的问题。今天自己碰到 ... -
[转]RAW FileSystem Recovery
2007-07-11 09:09 958To know ho ... -
关于人工神经网络中的M-P模型的一点疑问
2007-08-08 22:31 887人工神经网络M-P模型构成一个逻辑非模型,从书中抄下来的,如下 ... -
JOONE(Java Object-Oriented Network Engine)使用初探
2007-09-30 16:03 12331 /**/ ... -
OpenGL in VC++
2008-01-19 00:30 957首先看一个简单的例子: 1 #include <wind ... -
VC++中的ON_COMMAND_RANGE宏
2008-01-26 13:51 1715VC++中的ON_COMMAND_RANGE宏 ... -
[转] 软件企业以人为本的16项措施
2008-05-25 09:19 693软件企业以人为本的16项措施 ...
相关推荐
数据挖掘相关资料数据挖掘相关资料数据挖掘相关资料数据挖掘相关资料
搜索引擎及网络数据挖掘相关技术研究.pdf
数据挖掘相关理论 以及案例 等相关情况的介绍
李航的统计学习方法,数据挖掘导论,python科学计算第二版,利用python进行数据分析
WEB数据挖掘相关术语整理,详细整理和介绍了Web数据挖掘相关的名词以及原理。
web数据挖掘相关论文,以及他在社交网络中的社交研究
数据挖掘相关的权威期刊和会议列表,列出了非常多的数据挖掘相关的权威期刊和会议,对数据挖掘的研究非常有帮助。
2017数据挖掘相关最新论文,包括数据清洗,实践分析等
数据挖掘相关资料.pptx
关于数据挖掘的相关基础知识,另配录像资料,大数据挖掘乃当今热门,本材料有的借鉴哦!
多媒体数据集中的数据挖掘:系统框架和方法 基于数据挖掘的模块评估法 基于数据挖掘技术的高校管理决策支持系统 空间数据挖掘技术 空间数据挖掘与发展趋势研究 数据挖掘及其应用研究回顾 数据挖掘技术及其应用简介 ...
r语言数据挖掘相关书籍整理,包括的书籍有: 统计建模与R软件.pdf R语言实战(中文完整版).pdf R-导论中文版.pdf R语言颜色表.pdf shiny-chinese.pdf ggplot2-cheatsheet.pdf 可以用来学习概率统计及数据挖掘相关...
WEB数据挖掘相关术语整理.pdf
信息安全中隐私保护数据挖掘相关技术探究.pdf
对云计算的海量数据挖掘相关问题的再探讨.pdf
中医信息化与数据挖掘相关文献的计量分析.pdf
数据挖掘相关算法 里面有很多好用的算法 包含JAVA 聚类算法等
与数据挖掘相关的整数矩阵的左右可逆性研究.pdf