`
wolongshan
  • 浏览: 68531 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

企业数据仓库中元数据的应用研究

阅读更多

企业数据仓库中元数据的应用研究

2009-9-18 作者:于千城 网友评论 0 条 点击进入论坛

  0 引 言

  以数据仓库为核心的商务智能(BI)技术日益受到业界重视,许多BI系统己经投入使用,带来了巨大的效益。但是数据仓库的数据质量问题已经严重影响了商务智能的应用能力,由此引发了人们对元数据管理和应用的研究。

  元数据是“关于数据的数据”或“关于数据的结构化数据”,即关于数据的内容、质量、状况和其他特性的信息。

  1 数据仓库的数据质量问题

  基础数据的正确性、真实性直接影响到报表和分析结果的可信度。突出的数据质量问题包括:

  ● 数据被错误理解

  ● 重要的事实错误传达

  ● 不能判断商业变化造成的影响

  ● 缺乏工具连贯性

  ● 缺乏查帐索引

  数据质量问题主要是由分公司本身录入、业务系统新旧多次切换和升级、业务扩展操作等原因造成。

  从图1数据质量管理体系架构图我们可以看到:元数据是数据质量管理实现的基础,元数据管理支撑功能的实施是数据质量管理系统的核心。

 

 

  图1 数据质量管理体系架构图

  数据质量管理系统的核心是元数据管理支撑功能的实施:

  ● 数据质量管理包含元数据管理

  ● 元数据管理功能为数据质量管理提供支撑

  元数据是数据质量管理系统实现的基础,是描述和控制BI系统中数据的数据,对上层功能提供信息支撑。

  2 应用元数据提高数据质量的应用实例

  可以提高数据质量的主要元数据业务应用包括:元数据浏览、数据时效性探察、指标管理与分析、数据血统分析、影响分析、处理过程分析、表重要程度分析和表无关程度分析等。

  2.1 数据血缘分析

  辅助管理人员对由BI系统提供的报表、指标的数据项进行血缘分析,了解该指标或报表元素由源系统到BI系统,由数据仓库到前端显示或者报表系统的计算过程和处理方法,管理人员可以通过血缘分析结合数据时效性探查来了解提供报表和指标的可信度或对CPIC的相应的指标定义和有关规范进行核查。

  业务人员可以对由BI系统产生的某一个指标或者报表元素进行血源分析,即已知某一数据项,查找到该数据项从源系统到前端展示的若干ETL过程相关的数据项、计算方法、计算公式,形成该报表元素(或指标)的族谱图,从而了解产生该数据项的流程。

  2.2 处理过程分析

  处理过程分析与数据血缘分析类似,但处理过程分析给出的是过程的执行相关信息,数据血缘分析给出的是数据的流动信息。

  2.2.1 影响分析

  影响分析使你可以回答类似下面的一些问题:

  ● 我所做的这个改动还会影响到别的什么地方?

  ● 这个对象还依赖于别的什么对象?

  图2展示了在金融业务BI应用中用MetaStage进行交叉工具对数据质量影响的分析,我们可以清晰地通过元数据管理工具分析出—个数据对象在数据处理链条上的所有依赖关系。

 

 

  图2 MetaStage交叉工具影响分析示例

  2.3 数据时效性探察

  BI系统中的数据时效性是BI系统中数据质量的重要的组成部分,通过对BI系统元数据的管理,可以分析到某一条或某一些数据的时效性。首先通过元数据浏览和检索功能,检索感兴趣某个数据项相关的元数据信息,探察该数据最后计算的时间;然后,通过元数据ETL分析,找到该元素以及和该元素相关的计算元素的ETL过程(从生产系统到数据仓库,再从数据仓库到前端展示系统)的最终执行时间。对上述时间进行探查分析,以决定该数据的时间有效性和真实性。

  2.4 元数据相关性分析

  在调整BI系统时,经常遇到调整一些系统而影响其他系统的情况。为了保证数据的一致性,需要对整个BI系统中的相关的元数据进行调整。此时,通过元数据相关性分析,找到所有需要进行调整的元数据,可以统一进行修改和调整。

  3 结束语

  元数据管理是提高数据仓库数据质量的必由之路,元数据管理的复杂性及元数据管理的很多内容仍然需要依靠管理制度、流程、其它辅助工具以及人工参与来共同完成。

<!--新闻内容//--><!--评论发布-->
分享到:
评论

相关推荐

    论文研究-领域本体方法在数据仓库元数据管理中的应用研究.pdf

    提出一个利用领域本体解决数据仓库元数据管理中的语义异构问题的方法,即在局部元数据与领域本体之间建立映射,利用领域本体对局部元数据进行语义集成。最后,在医疗领域数据仓库项目建设中,进行了实验数据分析。...

    领域本体方法在数据仓库元数据管理中的应用研究

    领域本体方法在数据仓库元数据管理中的应用研究

    eBay数据仓库实践:元数据管理及应用

    eBay数据仓库实践 元数据管理及应用

    【推荐】数据仓库建设学习资料合集(38份).zip

    元数据管理在数据仓库的实践应用 Hadoop数据仓库实践 IBM Netezza 数据仓库设备架构 SaaS模式云数据仓库实践手册 58交易营销数据仓库建设 数据仓库与数据挖掘: - 基于数据仓库的数据挖掘技术 - 数据仓库和数据挖掘...

    【推荐】数据仓库理论学习与实践资料合集(104份).zip

    数据仓库理论学习与实践资料合集,共104份。...数据仓库元数据管理 数据仓库中的粒度 数据仓库主题建模点滴 数据分析系统解决白皮书 数据库实施手册 主流数据仓库产品对比分析 OLAP解决方案:创建多维信息系统

    数据仓库(教材

    第15章 数据仓库及其应用 2 15.1数据仓库发展的由来 2 15.2数据仓库的概念 3 15.3 数据仓库体系结构 5 15.3.1 数据仓库的概念结构 5 15.3.2 数据仓库的层次结构 6 15.4 ETL 8 15.5 数据集市及其结构 10 15.6 元数据 ...

    数据仓库系统中元数据的研究与应用

    讨论了数据仓库系统中元数据的内容、功能及其管理和维护。在M icrosoft M eta Data Service 和Open InformationModel (O IM ) 模型的基础上, 给出了一个元数据管理和维护系统的实例

    金融数据仓库中ETL的设计与实现

    硕士论文 摘要:本文首先介绍了ETL的相关技术:数据仓库的体系结构和元数据的定义;然后分析了金融数据的...最后以一个源数据的输入、中间的转化以及最终元数据的生成为例展示了本文设计的ETL在金融数据仓库中的应用。

    数据仓库 电子书

    主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。...

    元数据管理在数据仓库的实践应用.pdf

    元数据管理在数据仓库的实践应用

    数据仓库使用手册

    传统的关系数据库一般采用二维数据表的形式来表示数据,以维是行,另一维是列,行和列的交叉处就是数据元素。关系数据的基础是关系数据库模型,通过...使用维护阶段包括:数据仓库应用、数据仓库维护和数据仓库评价。

    数据仓库的原理与应用

    第2章介绍数据仓库的技术体系、元数据管理。第3章介绍数据仓库的分析设计方法。第4章介绍数据仓库的管理。第5章介绍一种数据仓库开发工具。第6章介绍数据开采的主要理论和方法,第7章介绍联机分析概念、技术和相关...

    浅谈数据仓库中的元数据管理技术

    数据仓库是数据库的发展方向之一, 对企业管理和决策支持起着重要的辅助作用。简要介绍了数据仓库和元数据的基本概念,重点阐述了元数据的概念、作用、CWM标准、来源,并就元数据具体应用进行了初步的研究和探讨

    北京中科信软数据仓库培训

    第二天上午 元数据简介 数据仓库元数据定义、类型以及在数据仓库环境中的角色 数据仓库元数据的类型 开发元数据的策略等 中间休息十分钟 数据仓库基本概念介绍 数据仓库的基本元素 数据仓库的基本形式 数据仓库...

    数据挖掘的元数据管理及可集成研究

    基于ERP建模体系,应用面向对象程序设计工具 和关系数据库工具,研究数据仓库元数据实现和管理。通过定义指标实体、维度实体、 详细类实体和关系实体,引入动态数组技术,并通过对关系数据库中二进制大对象...

    决策型数据仓库

    数据仓库和联机分析处理(OLAP)是决策支持基本要素,已经日益成为数据库行业的重点。许多商业产品和服务现已推出,并且所有主要的数据库管理系统供应商现在已经在这些领域提供产品。决策支持,相比于传统的联机事务...

    数据仓库元数据和ETL

    数据仓库学习的好东西,包括数据仓库的高级应用,元数据的作用和使用方法,以及ETL的介绍和使用,是数据仓库学习的非常好,快的一个PPT软件

    元数据管理在数据仓库的实践应用.docx

    元数据管理在数据仓库的实践应用.docx

    数据挖掘在各行业的应用论文

    数据仓库、数据挖掘在银行中的应用.caj 基于信息熵的地学空间数据挖掘模型.caj 数据挖掘及其在商业银行中的应用.caj 数据挖掘与决策支持系统.caj 数据仓库、数据集市和数据挖掘.caj 数据仓库与数据挖掘1.caj IDSS 中...

    数据仓库培训学习资料

    一数据仓库的发展历史以及相关概念介绍 ...三数据仓库设计与应用 1.数据模型设计 2. 数据仓库优化技术 3.数据仓库的展现技术 4.数据仓库的应用:数据挖掘 5. 数据仓库实施经验介绍 四 未来数据仓库的发展趋势

Global site tag (gtag.js) - Google Analytics