`
lizhiyu211
  • 浏览: 226170 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

星型模型与雪花模型

 
阅读更多

星型模式 vs 雪花模型多维数据建模以直观的方式组织数据,并支持高性能的数据访问。

每一个多维数据模型由多个多维数据模式表示,每一个多维数据模式都是由一个事实表和一组维表组成的。多维模型最常见的是星形模式。

星形模式

在星形模式中,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接。在星型的基础上,发展出雪花模式,下面就二者的特点做比较。 星型模式位于星形中心的实体是指标实体,是用户最关心的基本实体和查询活动的中心,为数据仓库的查询活动提供定量数据。每个指标实体代表一系列相关事实,完成一项指定的功能。位于星形图星角上的实体是维度实体,其作用是限制用户的查询结果,将数据过滤使得从指标实体查询返回较少的行,从而缩小访问范围。每个维表有自己的属性,维表和事实表通过关键字相关联。星形模式虽然是一个关系模型,但是它不是一个规范化的模型。在星形模式中,维度表被故意地非规范化了,这是星形模式与OLTP系统中的关系模式的基本区别。

使用星形模式主要有两方面的原因:提高查询的效率。

采用星形模式设计的数据仓库的优点是由于数据的组织已经过预处理,主要数据都在庞大的事实表中,所以只要扫描事实表就可以进行查询,而不必把多个庞大的表联接起来,查询访问效率较高。同时由于维表一般都很小,甚至可以放在高速缓存中,与事实表作连接时其速度较快;便于用户理解。对于非计算机专业的用户而言,星形模式比较直观,通过分析星形模式,很容易组合出各种查询。

总结:非正规化;多维数据集中的每一个维度都与事实表连接(通过主键和外键);不存在渐变维度;有冗余数据;查询效率可能会比较高;不用过多考虑正规化因素,设计维护较为简单雪花模式 在实际应用中,随着事实表和维表的增加和变化,星形模式会产生多种衍生模式,包括星系模式、星座模式、二级维表和雪花模式。

雪花模式

雪花模式是对星形模式维表的进一步层次化,将某些维表扩展成事实表,这样既可以应付不同级别用户的查询,又可以将源数据通过层次间的联系向上综合,最大限度地减少数据存储量,因而提高了查询功能。雪花模式的维度表是基于范式理论的,因此是界于第三范式和星形模式之间的一种设计模式,通常是部分数据组织采用第三范式的规范结构,部分数据组织采用星形模式的事实表和维表结构。在某些情况下,雪花模式的形成是由于星形模式在组织数据时,为减少维表层次和处理多对多关系而对数据表进行规范化处理后形成的。

雪花模式的优点是:在一定程度上减少了存储空间;规范化的结构更容易更新和维护。同样雪花模式也存在不少缺点:雪花模式比较复杂,用户不容易理解;浏览内容相对困难;额外的连接将使查询性能下降。在数据仓库中,通常不推荐“雪花化”。因为在数据仓库中,查询性能相对OLTP系统来说更加被重视,而雪花模式会降低数据仓库系统的性能。

总结:正规化;数据冗余少;有些数据需要连接才能获取,可能效率较低;规范化操作较复杂,导致设计及后期维护复杂;实际应用中,可以采取上述两种模型的混合体:如:中间层使用雪花结构以降低数据冗余度,数据集市部分采用星型以方便数据提取及和分析。

 

 

 

分享到:
评论

相关推荐

    数据仓库架构星型模型VS雪花模型.docx

    数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS...

    数据仓库架构星型模型VS雪花模型.pdf

    数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型...

    星型雪花模型多维数据建模

    星型模式、雪花模型多维数据建模分析,包含不同的数据建模方法

    大数据BI框架知识点备注.pdf

    数据模型: 1、星型模型和雪花模型,同样是将业务表拆分成事实表和纬度表;例如⼀个员⼯数据表,可以拆分为员⼯事实表和职位维度表、时间维度表等; 上⾯这个例⼦实时上不恰 当,事实表更多的应该是记录⼀类事务,...

    企业大数据平台下数据仓库架构(阿里云栖花积分买的)

    星型模型 AND 雪花模型 两种模型是并存的 星型是雪花的一种,理论上真实数据的 模型都为雪花模型,实际数据仓库中两 种模型会并存。 中间层将雪花转变成星型 星型模型相对结构简单,在数据中间层 利用数据冗余将雪花...

    mondrian源码分析报告

    Mondrian是一个开放源代码的Rolap服务器,使用java开发的。它实现了xmla和jolap规范,而且自定义了一种使用mdx语言的客户端接口。...在功能上,Mondrian支持共享维和成员计算,支持星型模型和雪花模型的功能。

    mondrian3.5

    Mondrian是一个开放源代码的Rolap服务器,使用java开发的。它实现了xmla和jolap规范,而且自定义了一种使用mdx语言的客户端接口。...在功能上,Mondrian支持共享维和成员计算,支持星型模型和雪花模型的功能。

    mondrian 如何使用xml存储olap服务器的元数据.doc

    在功能上,Mondrian支持共享维和成员计算,支持星型模型和雪花模型的功能。 Mondrian中使用物理的xml文件存储元数据,它的设计者规定了xml文件的格式。下面简单介绍一下它是如何存储元数据的。

    基于大数据的数据仓库-数据仓库建模基本理论.pdf

    星型模型: 雪花模型: 星型模型和雪花模型的主要区别在于对维度表的拆分,对于雪花模型,维度表的设计更加规范,⼀般符合3NF;⽽星型模型,⼀般采⽤降维 的操作,利⽤冗余来避免模型过于复杂,提⾼易⽤性和分析...

    Olap模型设计指南

    Olap模型设计指南 详细介绍实战技巧 维度建模 星型雪花架构

    大数据仓库与大数据挖掘课程教学设计.doc

    创建维表:有3种方法:星型模型、雪花模型和星暴模型。星暴模型含有两张以上的 事实表。基本有些充当维事实表。 星型模型:所有信息维都放在同一个维表中。维表信息包含一个唯一的标识符(ID) 和通过这个维表建立...

    Greenplum应用开发1

    1.1 逻辑数据模型2 1.1.1 支持通用的数据建模方式 2 1.1.4 星型模型概述3 1.1.4.3 星型模型实例 3 1.1.5 雪花模型实例4 1.1

    金融业数据仓库中星型衍生子维度模式 (2013年)

    分析了维度模型中星型模式和雪花模式的优缺点,并针对金融业数据仓库特点,以证券业务为例,提出了星型衍生子维度模式概念,阐述了此结构的生成条件、算法和优点,即在典型的星型模式中,对大维度表中基数较小的相对...

    002数仓建模理论知识

    002数仓建模理论知识 三范式建模理论; ER实体模型: 在信息系统中,将事物抽象为“实体”、“属性”、“关系”来表示数据...说起维度建模,你不得不知道以下几个概念:事实表、维度表、星型模型、雪花模型、星座模型

    北京中科信软oracle培训课件

    介绍星型模型,简介雪花模型和星座模型 中间休息十分钟 构建数据仓库: 抽取数据简介 构建数据仓库的ETL (Extraction, Transformation, and Loading)概述 ETL任务, 重点和代价 解释如何去检查数据源 Oracle的...

    北京中科信软数据仓库培训

    介绍星型模型,简介雪花模型和星座模型 中间休息十分钟 构建数据仓库: 抽取数据简介 构建数据仓库的ETL (Extraction, Transformation, and Loading)概述 ETL任务, 重点和代价 解释如何去检查数据源 Oracle的...

    Hbase、Hive的整合教案.txt

    个或多个维表没有直接连接到事实表...雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 " 层次 " 区域,这些被分解的表都连接到主维度表而不是事实表

    商务智能复习题答案(自己整理)1

    2、数据不能很好反应潜在的模式 3、数据属性存在冗余 2、雪花模型雪花模型是对星型模型的扩展,每一个点都沿半径向外连接到多个点.雪花模型对星型的维表进一步标准化

    浅谈数据仓库建设中的数据建模方法

    如何理解TERADATA 的 FS-LDM 概念模型是什么? 雪花模型和星型模型的区别,维度建模的应用场景

    数据仓库与多维模型设计

    模型构架 尽量使用星型架构,使用雪花架构的目的是使事实表第一级的维表数量达到最小。

Global site tag (gtag.js) - Google Analytics