
多维数据分析的概念非常容易引起疑惑,它常常让人联想到超越三维的更高维空间中的一些几何概念。其实这是完全没有必要的,多维数据分析概念本质上是极为简单和容易理解的,今天小编就用深入浅出的方式介绍这几个概念。
多维数据结构
概念一:Cube(又称多维数据集或数据立方体)
举个例子,您在超市结账后会得到一个小票,上面有时间、店铺、商品类别、商品单价、购买数量、消费金额等信息,如果把某个地区全部消费者的小票收集到一起,那么这些购物小票中的数据就形成了一个关于消费者超市购物行为的数据集,这就是一个Cube。
Cube就是面向同一业务主题的数据集合,同理,一个港口的进出口数据集合、一个贸易公司的渠道销售数据集合、近几年各省份户籍变动数据都可以视为一个个Cube。
概念二:Dimension(又称维度)
超市小票的Cube里隐含着很多信息,如:
- 哪些商品呈现出季节性消费规律?
- 不同区域店铺的顾客购买力如何?哪几个店铺的顾客平均购买力最强?
- 不同年龄段消费者最爱购买的商品有没有差别?
- 哪些商品由于不受年轻消费者欢迎可能会被渐渐淘汰?
由上可见,这个超市小票Cube可以由商品、时间、区域、店铺、顾客等业务角度来描述,这些业务角度就是维度。
同理,贸易公司的渠道销售Cube可以由时间、渠道、产品、分公司、客户等业务角度所描述,那么它所关联的维度就是时间、渠道、产品、分公司、客户。
我们还可以看到,小票Cube和渠道销售Cube都关联了时间这个维度,那么这两个Cube是可以联合起来进行跨行业、跨领域数据分析的。
概念三:Measure(又称度量)
在Cube中,除了维度所代表的业务角度信息外,还有度量这个能够被精确量化的数值信息。
小票Cube中的商品购买数量、商品单价、消费总额就是度量。
今天讲解了Cube、Dimension、Measure这三个多维数据分析中的核心概念,其他概念将会在后续文章中讲解。
关注小编可以获得更多数据分析知识分享。



