`
热开水
  • 浏览: 70289 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类

数据仓库总结

SQL 
阅读更多
1 模型就是抽象化
这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。
2 举一个小例子
现实世界 概念世界 逻辑世界 计算机世界
信用 特性 属性 列(字段、数据项)
张三 个体 实体 记录
客户 整体 同质总体 表文件
客户与产品 整体间联系 异质总体 数据库
3. 数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描述数据和细节数据
4 数据仓库物理模型的优化问题
1.合并表:几个表的记录分散存放在几个物理块中时,多个表的存取和连接操作的代价会很大。
2.建立数据序列:按照某一固定的顺序访问并处理一组数据记录。将数据按照处理顺序存放到连续的物理块中,形成数据序列。
3.引入冗余:一些表的某些属性可能在许多地方都要用到,将这些属性复制到多个主题中,可以减少处理时存取表的个数。
4.表的物理分割:每个主题中的各个属性存取频率是不同的。将一张表按各属性被存取的频率分成两个或多个表,将具有相似访问频率的数据组织在一起。
5.生成派出数据:在原始数据的基础上进行总结或计算,生成派出数据,可以在应用中直接使用这些派出数据,减少I/O次数,免去计算或汇总步骤,在更高级别上建立了公用数据源,避免了不同用户重复计算可能产生的偏差。
5 。
从用户的角度分析
从技术的角度分析
6 。
1.索引创建策略
建立索引时,按照索引使用的频率,由高到低逐步添加。
按主关键字和大多数外部关键字建立索引
2.事实表索引的创建
事实表中一定要设置主键
3.维表索引的创建
4.数据加载索引的创建
关系型数据库、多维数据库和对象数据库 。




5 多维数据库
  总结起来就是:横向的是一个空间。(一张表) 纵向又是一个空间。(一张表)。
1.MOLAP的创建
阶段:
选择功能
确定分析数值
构造分析维
定义逻辑模型




数据库设计的部分:
举例:用PERSON 实体和PERSON_TYPE 实体来描述人员。比方说,当John Smith, Engineer 提升为John Smith, Director 乃至最后爬到John Smith, CIO 的高位,而所有你要做的不过是改变两个表PERSON 和PERSON_TYPE 之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE 表就包含了所有PERSON 的可能类型,比如Associate、Engineer、Director、CIO 或者CEO 等。还有个替代办法就是改变PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的具体时间。
此例子:说明了处理的一种方式、。多角度考虑问题。

复合主键:
Create Table 表名 (字段名1 Int Not Null,
   字段名2 nvarchar(13) Not Null Primary Key (字段名1, 字段名2),  多个字段标示唯一的实体。
       在SQL查询效率上  复合主键和单主键 都是一样。  但是 操作来说只是要比单个的主键复杂一些。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics