分享

大数据可视化应用——多维分析

 xxcc140 2020-03-04

在日常的数据分析体系中,多维分析是支撑您深入洞察数据价值的核心能力,丰富的维度模型分析能够支撑您以更加广泛和深入的视角进行数据探索。掌握多维度数据分析,将使您的工作效率事半功倍,本文无须任何技术背景,即可轻松了解多维度数据分析。

一、总体介绍

在进行多维数据分析讲解之前,我们需要模拟一个数据分析应用场景,某企业现有如下表格的销售数据:

大数据可视化应用——多维分析


表格中每一行表示某个时间内某商品在某个地区的销售情况。由表可知,表格中数据涉及到了时间、地区、产品三个业务角度。

在对数据进行分析时,不同的角色看待数据的角度是不一样的,各个角色都会基于自身的业务角度出发分析问题。

l 角色A:销售经理

业务特质:关心各个地区的销售情况,希望找到销售增长率在平均水平之下的地区。

l 角色B:产品经理

业务特质:希望了解近期内各种产品的销量对比,以作为后期产品研发方向的参考。

l 角色C:CEO

业务特质:想要了解一段时间内整体销售环比信息,用以评估是否达到公司运营目标

对于表格中的数据,可以将其转换为另一种数据格式——'三维空间立方体',如下图所示:

大数据可视化应用——多维分析

将数据以三维立体的形式展现,更能清晰的体现表格的数据结构。

在此立方体中,每一个坐标轴都代表一个业务角度(时间、地区、产品),坐标轴上的坐标值则表示了某个业务角度的一个确定的值(如:江西省、3月份、耳机),不同坐标轴坐标值的交叉点则表示一个具体的销售额。

此数据立方体中表示业务角度的坐标轴就是维度,类似于三维立方体的数据结构则被称为多维数据结构(也称数据立方体)。

再次回顾角色A、B、C:销售经理、产品总监、CEO各自提出的问题,不难发现他们各自所关注的维度分别为:地区、产品、时间

大数据可视化应用——多维分析

上述案例较为简单,因为只有三个维度,因此可以将其表示为一个三维立方体。

在实际生产情况中,企业遇到的数据分析问题,往往更复杂,需要考虑更多的维度。此时,三维立方体结构的呈现方式已不能满足。但数据分析的思路是保持不变的,仅需要从考虑分析者的关注角度出发即可,即不需要了解十几甚至几十维的数据如何存储,也无需考虑多维数据查询的具体实现方式。

二、核心概念简介

在多维数据分析领域中,有几个非常重要的核心概念:

l 数据立方体(Cube)

l 维度(Dimension)

l 成员(Member)或维度成员(Dimension Member)

l 度量(Measure)

l 级别(Level)

大数据可视化应用——多维分析

维度(Dimension)

大数据可视化应用——多维分析

维度就是描述数据的业务角度。在不同的数据分析场景中,会存在若干个不同的维度。

以上图为例,存在三个维度:时间、地区、产品。在这个数据分析场景中,“哪种产品销量最好?”这样的问题显然主要关注的是产品这个维度,而“哪些地区连续六个月销售额环比增长?”则同时关注了地区和日期两个维度。

在一个多维数结构中,维度可以被抽象理解成一个坐标轴,图1中所示的数据分析场景由三个维度组成,每个维度各自代表了三维空间中的一个坐标轴。

相对于三维空间,具有更多维度的空间结构显然不易于被理解,实际上,您并不需要在头脑中想象出一个更多维度的空间场景,下文中几个简单的步骤将帮助您快速理解多维空间结构:

1. 一维空间

一维空间是一条线,只有一个坐标轴,坐标轴上的一个坐标值就能确定一个点

2. 二维空间

二维空间是一个平面,具有两个坐标轴,不同坐标轴上的两个坐标值确定一个点

3. 三维空间

三维空间具有长、宽、高三个坐标轴,三个坐标轴坐标值确定一个点

4. N维空间

N(N可以是大于零的任意整数)维空间中具有N个坐标轴,需要N个不同坐标轴上的坐标值才能确定一个点

维度成员(Dimension Member)

维度成员则非常类似于维度坐标轴上的坐标值。

大数据可视化应用——多维分析

在时间维度中,“一季度”、“二季度”、“一月”等维度成员属于时间维度,表示了时间维度中的一个具体时间段。

由下图可知,同一维度下的维度成员表示树状结构,可将无子级成员的成员称为明细成员(Leaf Member),其他成员称为非明细成员。

大数据可视化应用——多维分析

数据立方体(Cube)

数据立方体表示由若干个维度所描述的一个数据集合,每个维度各自表示一个可对此数据集合进行观察和分析的业务角度。

大数据可视化应用——多维分析

之所以称为“立方体”,是因为由三个维度所描述的一个数据集,能够非常轻松的被想象成三维空间中的一个立方体结构。

有一点需要注意,在多维数据分析体系中,一个数据立方体往往具有更多的维度,虽然更多维度形态并不像三维空间立方体那样直观,但维度表示某些业务角度的作用不会改变。

度量(Measure)

大数据可视化应用——多维分析

在一个数据立方体中,从每个维度上都选取一个确定的维度成员,这些维度成员组合所确定的一个点就是度量值。

如图所示,从日期维度中挑选一个维度成员:1月份、地区中挑选:江西省、产品挑选:耳机,即确定了一个最细粒度的数据方块,这个小数据方块就是销售额为6688这个度量值,小方块即可称为“南昌地区1月份耳机销售额为6688”

一般情况下,数据立方体中不能直接储存非明细成员所描述的度量值,而是通过对其子级成员(明细成员)进行汇总计算得出。例如图中,无数据立方体可表示“江西省第一季度耳机销售额”,但1月、2月、3月为第一季度子级成员,所以“江西省第一季度耳机销售额”可通过汇总得出。

大数据可视化应用——多维分析

级别(Level)

级别表示维度成员所描述业务角度的细节程度,也可理解为通过维度成员观察数据的粒度。例如日期维度中一季度、1月这两个成员,分别属于季度、月份两个不同的级别,显而易见,季度级别的维度成员描述数据的粒度较为宽泛,月级别则较为细致。

大数据可视化应用——多维分析

了解多维分析后,结合博微易数即可进行自主可视化分析。博微易数涵盖绘制图表、制作看板两大模块。您可以选择打开某个应用,进入图表模块绘制图表,然后进入看板模块制作看板,完成自助式数据可视化分析报告。

多维联动分析:提供多样性图表选择,功能丰富,用户可根据自身需求任意改变维度及数值的组合,同时支持图表联动筛选,多层级数据维度下钻,帮助用户探究到数据更深层次的联系,作出更精准的决策。

大数据可视化应用——多维分析

自定义拖拽布局:支持灵活的自由式布局,只需点击拖拽组装,即可实现页面自定义布局。可在看板任意位置插入图表等控件,自适应排版、自适应主流分辨率尺寸

大数据可视化应用——多维分析

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多