`

什么是数据仓库

 
阅读更多

摘自: 《Data Mining - Concepts and Techniques》 

 

According toWilliam H. Inmon, a leading architect in the construction of data warehouse

systems, “A data warehouse is a subject-oriented, integrated, time-variant, and

nonvolatile collection of data in support of management’s decision making process”

[Inm96]. This short, but comprehensive definition presents the major features of a data

warehouse. The four keywords, subject-oriented, integrated, time-variant, and nonvolatile,

distinguish data warehouses from other data repository systems, such as relational

database systems, transaction processing systems, and file systems. Let’s take a closer

look at each of these key features.

Subject-oriented: A data warehouse is organized around major subjects, such as customer, supplier, product, and sales.Rather than concentrating on the day-to-day operations and transaction processing of an organization, a data warehouse focuses on the modeling and analysis of data for decision makers. Hence, data warehouses typically provide a simple and concise view around particular subject issues by excluding data that are not useful in the decision support process.

Integrated: A data warehouse is usually constructed by integratingmultiple heterogeneous sources, such as relational databases, flat files, and on-line transaction records. Data cleaning and data integration techniques are applied to ensure consistency in naming conventions, encoding structures, attribute measures, and so on.

Time-variant: Data are stored to provide information from a historical perspective (e.g., the past 5–10 years). Every key structure in the data warehouse contains, either implicitly or explicitly, an element of time.

Nonvolatile: A data warehouse is always a physically separate store of data transformed from the application data found in the operational environment. Due to this separation, a data warehouse does not require transaction processing, recovery, and concurrency control mechanisms. It usually requires only two operations in data accessing: initial loading of data and access of data.

分享到:
评论

相关推荐

    漫画:什么是数据仓库?.docx

    漫画:什么是数据仓库?.docx

    数据仓库数据仓库数据仓库

    主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。...

    2021数据仓库服务常见问题汇总-华为-51页.pdf

    1.1 什么是数据仓库? 1.2 数据仓库内核gaussdb 是自研吗? 1.3 为什么要使用数据仓库? 1.4 数据仓库适合哪些场合使用? 1.5 数据仓库和Hadoop 大数据平台有什么差别? 1.6 为什么要使用公有云数据仓库服务GaussDB...

    《数据仓库与数据挖掘》课程设计方案报告模板.pdf

    《数据仓库与数据挖掘》课程设计方案报告模板.pdf《数据仓库与数据挖掘》课程设计方案报告模板.pdf《数据仓库与数据挖掘》课程设计方案报告模板.pdf《数据仓库与数据挖掘》课程设计方案报告模板.pdf《数据仓库与数据...

    数据仓库数据集市BI数据分析介绍.pptx

    什么是数据仓库 广州市品高软件开发有限公司 3 一个面向主题的、集成的、非易失性的、随时间变化的数据的集合,以用于支持管理层决策过程。 数据仓库数据集市BI数据分析介绍全文共35页,当前为第3页。 数据仓库的...

    面对大数据的数据仓库系统.pptx

    数据仓库概述 什么是数据仓库 一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策指定过程。 ——W. H. Inmon 美国著名信息工程学家、数据仓库之父 面对大数据的数据仓库系统全文共...

    数据仓库,数据仓库入门

    1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...

    数据仓库绝密培训文档

    数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库培训文档数据仓库...

    数据仓库原理 数据仓库设计与应用 第4章 OLAP技术 联机分析处理技术(共29页).ppt

    数据仓库原理 数据仓库设计与应用 第2章 数据仓库开发模型(共30页).ppt 数据仓库原理 数据仓库设计与应用 第3章 数据仓库开发应用过程(共48页).ppt 数据仓库原理 数据仓库设计与应用 第4章 OLAP技术 联机分析...

    数据仓库笔记数据仓库笔记

    主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。...

    数据仓库 电子书

    主要内容包括数据仓库的设计与建造步骤,传统系统到数据仓库的迁移,数据仓库的数据粒度、数据分割、元数据管理、外部数据与非结构化数据,分布式数据仓库、高级管理人员信息系统和数据仓库的设计评审等。...

    数据仓库设计说明书

    1.12 监控数据仓库环境 17 1.13 小结 19 第2章 数据仓库环境 20 2.1 数据仓库的结构 22 2.2 面向主题 23 2.3 第1天到第n天的现象 26 2.4 粒度 28 2.4.1 粒度的一个例子 29 2.4.2 粒度的双重级别 31 2.5 分割问题 34 ...

    数据仓库资料数据仓库资料

    数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料数据仓库资料

    数据仓库数据湖数据中台建设详解-4.9

    全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、...

    数据仓库建模与ETL的实践技巧.ppt

    什么是数据仓库?数据仓库是存储所有业务数据的中心库,是BI系统的核心组件。 数据仓库和OLTP数据库的区别:数据仓库和OLTP数据库的区别在于数据仓库是面向分析和决策的,而OLTP数据库是面向交易的。 数据仓库的...

    【推荐】数据仓库建设学习资料合集(38份).zip

    推荐,数据仓库建设学习资料合集,包含建设规范、架构、工具及模型等资料。共38份。 2021数据仓库服务常见问题-华为-51页 2021云数据仓库专业服务-华为-168页 阿里云数据中台-金融行业新一代数据仓库解决方案 ...

    数据仓库的数据采集

    许多部件构成了数据仓库系统。这个系统从现有的操作系统开始,一部分为支持数据仓库而设的后台处理,以访问和运用数据仓库内数据的用户工具而结束。在中间是个分散过程,它使数据以一种局部而不是集中的方式来支持...

Global site tag (gtag.js) - Google Analytics