`
liwei888
  • 浏览: 92138 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

思维DW架构设计中的数据流架构规划

 
阅读更多

 

数据仓库的架构看起来天马行空。其中定义的集中架构模式已被无数人无数项目验证n次。数据仓库中心数据流部分或者也称之为数据架构将是把DW结构与项目的实时,企业的运作规则紧紧地绑定到了一起。

细想DW的数据方向可以从数据流架构、数据管理架构、企业的业务数据架构、数据安全、数据质量架构来分别阐述DW中数据流的表现。

我们来看第一个部分数据流的架构,从设计上来看应该是设计数据流需要多少个层次,每个层次的数据含义或数据流向要有适合自己的特性、以后的扩展性。拆分DW架构,其中的ODS是否只是为数据仓库做数据准备?还是是否按照业务主线穿起支持统一视图,或是否为了方便屏蔽Source 源的异构性,或为某个企业统一维度、是否按照主题划分、或考虑是为考虑到超大交易数据量进行阶梯预先处理。

拿集中式的架构方式中的EDW(EDS)是否需要保持最小粒度或是否计划和条件的去建设范式模式(3nf/准3nf或只做到2nf)、是否采用多个数据集市、多个的数据集市是否全部需要统一维度建模需要。数据集市到底要解答哪些问题或满足那些BI功能。

每部分的不同问题都决定了数据流架构需要如何设计,同时也决定一个企业上数据仓库的演进步骤等因素。

看到数据这个词首先会想到存了多少数据,换句话说考虑历史存储方式,需要根据数据的价值和使用频率。这里倒是可以参考DW2.0理论定义。

    数据是要保存的粒度,可以当成是存储方式的角度、从粒度上讲有维度模型的DW需要最小粒度。比较独立的时间维度在数据集市上到底是需要多大的粒度。从应用维度表与事实表的联系密度是多少。需要多少的维度信息放到事实表中。是否为了牺牲存储来形成大的宽表,方便报表或数据挖掘。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics