`

多维数据分析方法

阅读更多

多维分析可以对以多维形式组织起来的数据进行上卷、下钻、切片、切块、旋转等各种分析操作,以便剖析数据,使分析者、决策者能从多个角度、多个侧面观察数据库中的数据,从而深入了解包含在数据中的信息和内涵。多维分析方式适合人的思维模式,减少了混淆,并降低了出现错误解释的可能性。

多维数据分析通常包括以下几种分析方法。

1.切片

在给定的数据立方体的一个维上进行的选择操作就是切片(slice),切片的结果是得到一个二维的平面数据。例如,在例2-1中对图2-1所示数据立方体分别使用条件:“委托方式=现场”、“营业部编号=02”、“时间=2011-01”进行选择,就相当于在原来的立方体中切片,结果分别如图2-2所示。

 

2.切块

在给定的数据立方体的两个或多个维上进行的选择操作就是切块(dice),切块的结果是得到一个子立方体,如图2-3所示。

 

例如,对例2-1中的图2-1所示的数据立方体使用条件:

(时间=“3月”or“4月”)and(营业部编号=“02”or“03”)and(委托方式=“现场”)

进行选择,就相当于在原立方体中切出一小块,结果如图2-4所示。

 

3.上卷

维度是具有层次性的,如时间维可能由年、月、日构成,维度的层次实际上反映了数据的综合程度。维度的层次越高,所代表的数据综合度越高,细节越少,数据量越少;维度的层次越低,所代表的数据综合度越低,细节越充分,数据量越大。上卷(roll-up)也称为数据聚合,是在数据立方体中执行聚集操作,通过在维级别中上升或通过消除某个或某些维来观察更概括的数据。表2-2给出了进行数据上卷操作的示例。

表2-2 部分营业部2011年度的交易量(按年合计)
营业部编号  交易量/亿元  营业部编号  交易量/亿元
01  50  03  62
02  38  04  55

4.下钻

下钻(drill-down)也称为数据钻取,实际上是上卷的逆向操作,通过下降维级别或通过引入某个或某些维来更细致地观察数据。

5.旋转

通过数据旋转(pivot or rotate)可以得到不同视角的数据。数据旋转操作相当于基于平面数据将坐标轴旋转。例如,旋转可能包含行和列的交换,或是把某一维旋转到其他维中去,对例2-1中的图2-1进行旋转后的结果如图2-5所示。

 

转载 来自http://book.2cto.com/201311/35825.html

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics