`
wangmengbk
  • 浏览: 289562 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

数据仓库与ETL的实现过程

    博客分类:
  • BI
 
阅读更多
当我们了解了什么事BI(商业智能)以及数据仓库和ETL的概念后,我们就要进程相关操作,

ETL过程:是 数据从数据源向目标数据仓库抽取(Extract)、转换(Transform)、装载(Load)的过程。

构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

抽取:将数据从各种原始的业务系统中读取出来。
转换:按照预先设计好的规则将抽取得数据进行转换、清洗,以及处理一些冗余、歧义的数据,使本来异构的数据格式能统一起来。
装载:将转换完的数据导入到数据仓库中。

对于附件中是 数据仓库与ETL的实现过程 以及数据源可供参考。
注意 :对于HealthDW.bak 采用 sqlserver 2008 进行还原数据库操作。
       对于 WangShouOri.mdf 采用 数据库附加形式。
分享到:
评论

相关推荐

    数据仓库与ETL的实现过程PPT课件.pptx

    数据仓库与ETL的实现过程PPT课件.pptx

    设计并实现数据仓库ETL过程(IBM讲座)

    设计并实现数据仓库ETL过程(IBM讲座)

    SQL Server 2008 商业智能与实战\快速入门 之三 数据仓库与ETL的实现过程

    微软合作伙伴培训 SQL Server 2008 商业智能与实战\快速入门 之三 数据仓库与ETL的实现过程

    基于电信数据仓库系统的ETL研究与设计

    基于电信数据仓库系统的ETL研究与设计 李 颖 郝克刚 葛 玮 (西北大学软件工程研究所 陕西西安710127) 收稿日期: 2007 - 09 - 10。李颖,硕士,主研领域:软件工程。 摘 要 电信行业大都建立了自己的数据仓库系统...

    提高数据仓库的ETL效率

    数据仓库建设中的ETL(Extract, Transform, Load)是数据抽取、转换和装载到模型的过程,整个过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作,SQL语句的效率将直接影响到数据仓库后台...

    论文研究-基于数据仓库的通用ETL工具的设计与实现.pdf

    讨论了一种基于异构数据源通用ETL工具的设计方法和实现过程,它能实现异种数据源的数据转换,并将数据装载到中心数据库中,具有一定易用性、灵活性和扩展性。该工具根据索引库来获得目标数据库与源数据库的映射关系...

    转发_ETL的过程原理和数据仓库建设

    数据仓库建设中的ETL Extract Transform Load 是数据抽取 转换和装载到模型的过程 整个过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作 SQL语句的效率将直接影响到数据仓库后台的性能

    BI ETL ELT Kettle 基础知识中文文档汇总

    数据仓库ETl工具箱3.pdf 数据仓库ETl工具箱5.pdf 数据仓库ETl工具箱6.pdf 数据仓库ETl工具箱7.pdf 数据仓库ETl工具箱8.pdf 数据仓库ETL模式详解.ppt 数据仓库建模与ETL实践技巧.pdf 睿智ETL交流.pdf 第三章...

    如何从优化SQL入手提高数据仓库的ETL效率.doc

    数据仓库建设中的ETL(Extract, Transform, Load)是数据抽取、转换和装载到模型的过程,整个过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作,SQL语句的效率将直接影响到数据仓库后台...

    ETL实战ETL实战

    ETL 过程的主要目的是将数据从源系统中提取出来,然后转换成适合数据仓库的格式,最后加载到数据仓库中。 在 Project REAL 中,ETL 过程是使用 SQL Server 2005 Integration Services 实现的。这是一个高容量的 ETL...

    论文研究-基于结构图的ETL过程建模方法.pdf

    ETL是数据仓库获得高质量数据的重要环节,在数据仓库建设过程中占有极其重要的地位。为了便于ETL过程的设计、维护和修改,提出一种基于结构图的ETL过程建模方法,并依据该方法完成了ETL概念模型的设计。通过图形化...

    如何从优化SQL入手提高数据仓库的ETL效率[以Oracle为例]

    数据仓库建设中的ETL(Extract, Transform, Load)是数据抽取、转换和装载到模型的过程,整个过程基本是通过控制用SQL语句编写的存储过程和函数的方式来实现对数据的直接操作,SQL语句的效率将直接影响到数据仓库后台...

    数据仓库与数据挖掘考试习题汇总

    "数据仓库与数据挖掘考试习题汇总" 数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数据集合。元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据数据用途的...

    大数据技术 数据仓库设计与开发 数据仓库历史与现在发展状况 共15页.pdf

    数据仓库开发需要选择适合的数据仓库产品,设计合适的数据模型,实现数据的 Extract、Transform、Load(ETL)过程,并提供实时查询和数据分析功能。 数据仓库技术是企业信息化建设的关键部分,可以帮助企业集成大量...

    ETL架构师面试题

    1.什么是逻辑数据映射?它对ETL项目组的作用是什么? 2.在数据仓库项目中,数据探索阶段的主要目的是什么...29.简述几种不同的实时ETL实现方法以及它们的适用范围。 30.简述实时ETL的一些难点及其实现方法。 ......

    数据仓库与数据挖掘技术期末考试 试题

    "数据仓库与数据挖掘技术期末考试试题" 本试题涵盖了数据仓库和数据挖掘技术的多个方面,涉及到数据仓库的概念、数据挖掘的定义、雪花模型、OLAP、决策树等知识点。 一、名词解释 1. 数据仓库:是一个面向主题的...

    ETL规范.doc

    ETL 规范适用于所有涉及到数据集成的项目和应用,包括但不限于数据仓库、数据挖掘、商业智能、数据分析等领域。 ETL 规范的实施价值 ETL 规范的实施可以带来许多价值,包括: * 提高数据的一致性和完整性 * 提高...

Global site tag (gtag.js) - Google Analytics