`
yalong9527
  • 浏览: 76299 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

数据仓储20100510

阅读更多
一、体系结构设计环境的层次:操作层、原子或数据仓库层、部门层、个体层
    部门层常被称为“数据集市层”、O L A P层或“多维D B M S”层。
    部门层典型数据是月度顾客文件。在此文件中是一张所有顾客的分类列表。
    个体层数据常常是暂时的、小规模的。在个体层要做很多启发式分析。

    监控数据仓库环境中的数据能取得一些重要信息,包括:
        ■ 识别发生了什么增长,增长发生在什么地方,增长以什么速率发生。
        ■ 识别正在使用什么数据。
        ■ 估算最终用户得到的响应时间。
        ■ 确定谁在实际使用数据仓库。
        ■ 说明正在使用数据仓库中的多少数据。
        ■ 精确指出数据仓库何时被使用。
        ■ 识别数据仓库的多少数据被使用。
        ■ 检查使用数据仓库的层次。

    在数据监控处理期间,可以建立数据的各种概要文件包括:
        ■ 数据仓库中所有表的目录。
        ■ 这些表的内容。
        ■ 数据仓库中表的增长。
        ■ 用于访问表的可用的索引目录。
        ■ 汇总表和汇总源的目录。

    监控数据仓库活动的需求通过下列问题来说明:
        ■ 什么数据正在被访问?
            • 什么时候访问?
            • 由谁访问?
            • 访问频率怎样?
            • 在什么细节层次?
        ■ 对请求的响应时间是什么?
        ■ 在一天的什么时间提出请求?
        ■ 请求多大的数据量?
        ■ 请求是被终止的还是正常结束的?

二、数据仓库环境

  数据仓库问题的一些重要特性:
      (数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。)
     
      数据仓库的面向主题性;
      数据仓库的第二个显著特点是集成的
          当数据进入数据仓库时,要采用某种方法来消除应用问题中的许多不一致性
              如男女,所有在仓库中都应统一。
              命名习惯、键码结构、属性度量以及数据特点等。
      数据仓库的第三个重要特性是数据仓库是非易失的
          操作型数据随时都会对数据进行各位操作(更新删除等),数据仓库的数据常一   起载入与访问的,但在数据仓库环境中并不进行一般意义上的数据更新。
      数据仓库的最后一个显著特性是其随时间的变化性
          ■ 数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。操作型系统的时间期限一般是6 0~9 0天,而数据仓库中数据的时间期限通常是5~1 0年。
          ■ 操作型数据库含有“当前值”的数据,这些数据的准确性在访问时是有效的,同样当前值的数据能被更新。而数据仓库中的数据仅仅是一系列某一时刻生成的复杂的快照。
          ■ 操作型数据的键码结构可能包含也可能不包含时间元素,如年、月、日等。而数据仓库的键码结构总是包含某时间元素。

    在数据仓库中数据存在着不同的细节级:早期细节级(通常是备用的、批量的存储)、当前细节级、轻度综合数据级(数据集市)以及高度综合数据级。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics