分享

Excel数据分析工具库1

 吴敬锐 2019-11-13

Excel分析工具库可以完成的数据统计分析包括:描述统计、直方图、相关系数、移动平均、指数平滑、回归等19种统计分析方法。

与主流的专业统计分析软件SPSS、SAS等相比,Excel分析工具库的优点在于:

★ 与Excel无缝结合,操作简单、容易上手。

★ 聚合多种统计函数,其中部分工具在生成输出结果表格时,同时还能生成相应图表,有助于对统计结果的理解。

★ 使用这个现成的数据分析工具,不仅可以提高分析效率,还能够大幅降低出错的概率。

安装分析工具库

一般情况下,Excel是没有加载这个分析工具库的,需要我们自行加载安装。现在我们就来一起安装这个分析工具库。

STEP 01 单击【文件】选项卡,选择【Excel选项】。

STEP 02 在弹出的【Excel选项】对话框中,单击【加载项】,在【管理】下拉框中,选择“Excel加载项”,如图所示。

Excel数据分析工具库1

STEP 03 单击【转到】按钮,Excel会弹出【加载宏】对话框,勾选需要安装的加载宏——【分析工具库】复选框,若要包含分析工具库的VBA函数,则同时勾选【分析工具库—VBA】,单击【确认】按钮,即可完成加载安装,如图所示。

Excel数据分析工具库1

安装成功后,在【数据】选项卡【分析】组中,即可看到【数据分析】按钮,单击此按钮,即可弹出【数据分析】对话框,它提供各种统计分析方法,如图所示。

Excel数据分析工具库1

实现数据分析三大作用的分析方法归纳起来主要有两大类:一类是描述性统计分析,另一类是推断性预测分析。

Excel数据分析工具库各种统计分析方法归纳如图2-29所示。

Excel数据分析工具库1

描述性统计分析

描述统计分析的常用指标主要有平均数、方差、中位数、众数、标准差、方差等,提供分析对象数据的集中程度和离散程度等信息。

我们以某公司“用户消费数据”为例,利用用户消费金额这个变量来描述用户消费行为特征,分析了解用户消费分布。

STEP 01 单击【数据】选项卡【分析】组中的【数据分析】按钮。

STEP 02 在弹出的【数据分析】对话框中,选择【描述统计】,单击【确定】按钮,如图所示。

Excel数据分析工具库1

STEP 03 在弹出【描述统计】对话框中,对各类参数分别进行如下设置,如图所示。

Excel数据分析工具库1

输入

① 输入区域:输入需要分析的数据源区域,如本例中数据源区域为C1:C101(注:对话框参数会自动设置为单元格绝对引用,为便于阅读,后面在讲解操作步骤时均不带有绝对引用符号“$”)。

② 分组方式:选择分组方式,如果需要指出【输入区域】中的数据是按行还是按列排列,则选择“逐行”或“逐列”,如本例要选择“逐列”。

③ 标志位于第一行:若数据源区域第一行含有标志(字段名、变量名),则应勾选,否则,Excel字段将以“列1、列2、列3、……”作为列标志,本例勾选【标志位于第一行】。

输出选项

① 输出区域:可选当前工作表的某个活动单元格、新工作表组或新工作簿,本例将结果输出至当前工作表的F1单元格。

② 汇总统计:包含平均值、标准误差、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数等相关指标,本例勾选【汇总统计】复选框。

③ 平均数置信度:置信度也称为可靠度,或置信水平、置信系数,是指总体参数值落在样本统计值某一区内的概率,常用的置信度为95%或90%,本例勾选此复选框,并输入“95%”。

④ 第K大(小)值:表示输入数据组的第几位最大(小)值。本例勾选此复选框,并输入“5”。

STEP 04 单击【确定】按钮,输出结果如图所示。

Excel数据分析工具库1

接下来我们可以对用户消费能力进行如下详细解析。

① 表现数据集中趋势的指标有:平均值、中位数、众数。平均值是N个数相加除以N,所得到的结果;中位数是一组数据按大小排序,排在中间位置的数值;众数是该组数据中次数出现最多的那个数值。本例这些用户平均消费金额为5098。

② 描述数据离散程度的指标有:方差与标准差,它们反映的是与平均值之间的离散程度。

③ 呈现数据分布形状的指标有:峰度系数与偏度系数。

峰度系数是描述对称分布曲线峰顶尖峭程度的指标,是相对于正态分布而言的。峰度系数>0,两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布;峰度系数<0,表示两侧极端数据较多,比正态分布更矮更胖,呈平阔峰分布。如图所示,尖峭峰分布、正态分布、平阔峰分布很清晰地区分出来。

Excel数据分析工具库1

偏度系数是以正态分布为标准来描述数据对称性的指标。偏度系数=0,就是分布对称;如果频数分布的高峰向左偏移(偏度系数<0),长尾向右侧延伸称为正偏态分布;同样的,如果频数分布的高峰向右偏移(偏度系数>0),长尾向左延伸则成为负偏态分布。偏度系数大于1或小于-1,被称为高度偏态分布;偏度系数在0.5~1或-0.5~-1范围内,被认为是中等偏态分布;偏度系数越接近0,偏斜程度就越低。如图所示,正偏态分布、正态分布、负偏态分布很清晰地区分出来。

Excel数据分析工具库1

本例中,峰度系数<0且偏度系数<0,所以这些用户消费数据呈现为平阔峰式正偏态分布。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多