数据处理的下一步是数据分析,它主要有三大作用:现状分析、原因分析与预测分析。数据分析的方法通常可归纳为两大类:
有两款基于Excel环境的数据分析工具:一个是侧重于描述性分析的PowerPivot;另一个是侧重于推断统计分析的Excel数据分析工具库。先从PowerPivot开始: PowerPivot(简称PP)是微软在Excel 2010中新增的一个插件工具。在PP中,Excel的行、列限制已被取消,这样我们就能方便地操作更大型的数据,它有四大核心功能表现:
Access 、Microsoft、PowerPivot的对比 一般情况下,在Excel 2010中默认是没有安装PP的,在【文件】-【选项】-【加载项】中可以启用PP。 启用PowerPivot 我们使用之前的用户明细、订购明细作为数据源,使用PP进行数据分析: 1、确定分析思路并导入数据结合之前的数据,我们使用5W2H分析法确定分析思路: 5W2H分析法确定分析思路 打开PP面板导入数据源 PowerPivot导入数据 2、开始针对分析框架中的具体问题来分析,首先了解用户主要购买什么产品(What),及各产品的销量分布,这是需要建立与产品数量相关的数据透视表: 2.1、简单数据分析:在【开始】选项卡中,新建【数据透视表】 2.2、 将“订购明细”表中的“产品字段”添加至“行标签”,“数量”字段添加至“值”区域进行求和; 3、多表关联分析。要了解购买用户的特征(Who),例如地域是怎么分布的,哪个地区购买的用户最多,哪个地区购买的用户量最少。这个时候就需要建立两表之间的关联关系。 3.1 在【设计】选项卡中,单击【创建关系】; 3.2 创建关系后,新建一个数据透视表,将“用户明细”的“省份字段”添加至行标签,“订购明细”的“用户ID”添加至值区域计算求和计算,结果如下: 3.3.、添加“订单金额”一列,在函数输入框里输入:“=[数量]*[单价元]”,按[enter]键,运行结果如下: 3.4、我们需要了解用户是哪个月注册的,添加一个注册月份,单击fx按钮,选择MONTH函数,再运行函数。最后新建数据透视表,行标签选择“注册月份”,求值域选择“用户ID”,得出结果。 4、数据分组分析 4.1、我们需要对年龄进行分组,添加一个“年龄分组”的列,在fx函数输入框里,使用IF函数进行判断,判断语句为: =IF([年龄]<=20,'20岁及其以下',IF([年龄]<30,'21-30岁',IF([年龄]<40,'31-40岁','40岁以上'))) 运行结果如下: 之后新建数据透视表,行标签为“年龄分组”,求值域为“用户ID”。 4.2、日期时间分组,可以采用之前介绍过的FROMAT函数,这里不做过多讲解。 |
|