分享

主成分分析法

 吴敬锐 2019-10-15

背景

影响达成目标的因素存在很多种,利用数据定量确定各因素Xi对目标或Y值影响效果,从而达到数据驱动运营的效果。
其中,要确定因素Xi的权重。权重必须符合所有因素的权重累积和为1,即归一化。
下面,以“提升商品详情页”UV为例,按分析步骤应用主成分分析法。
注:本文所有数据为编造的虚假数据,仅为数据分析所用,不具有任何应用价值。

目标

  1. 提升商品详情页UV
  2. 为商品展示提供依据
  3. 提升商品销量
  4. 增加商城平台收益

应用价值

通过定量分析,确定各因素所占权重。得出影响因素的公式,可以确定出商品详情页受欢迎程度,为商品推荐、提升商品销量、首页商品位置设计提供动态的公式依据。

工具

  1. IBM SPSS Statistics 23(主要用于做因子分析)
  2. Excel(对SPSS分析结果进行整理,输出归一化因素权重)

原理

一般情况下,由于影响某目标的因素存在N多个,这些因素变构成N维空间数据。在这种情况下,这N维数据往往有具有一定的相关性,我们要确定这N维数据对目标的影响权重是非常困难的。然而,主成分分析方法提供给我们一种降维的思想,通过将N维因子进行正交变换,随即形成彼此之间相互独立的k维(k<N)数据,这种方法大大降低了分析的维度。并且,通过分析得出“主成分”,利用“主成分”确定影响权重,就变得简单可行。

思路

利用主成分分析方法确定多因素影响权重的大致思路如下所示:

  1. 利用SPSS进行因子分析
  2. 输出结果分析
  3. 确定权重

下面,详细介绍各步骤:

1. 利用SPSS进行因子分析

将数据导入或录入到SPSS数据视图中,并在变量视图中更改变量名称、类型、宽度、小数位数等参数。


image.png
image.png

点击工具栏中“分析” -> “降维” -> “因子分析”,呈现出因子分析框。

image.png

将需要分析的因子加入至变量框中。

image.png

并针对各统计框进行设置:
描述


image.png

提取


image.png

旋转
image.png

得分
image.png

2. 输出结果分析

按照上述步骤进行操作,输出因子分析结果。

Inked1499072828(1)_LI.jpg

根据上表“总方差解释”可以看出,前第三个成分的初始特征值均大于1,并且累计%已高达98.608,大于80%。因此,可以用前三个成分来代替原来的六个指标因素(UV、PV、销售额、销量、加入购物车数量、收藏数量)。这样,变降低了分析的维度。

image.png

从表总可以看出,第1,2,3主成分对于原指标的载荷数。例如,主成分1对于UV的载荷数为0.797。

3. 确定权重

下面利用Excel编辑公式,确定各因素的权重。
将“总方差解释”和“成分矩阵”两张表复制到Excel中,以备数据分析使用。

image.png
(1)确定主成分在各线性组合中的系数

利用表格“成分矩阵”中载荷数除以表格“总方差解释”中“总计值”开平方。
例如:成分1在UV中的系数为:0.797/SQRT(2.913)
结果如下图所示:

image.png
(2)确定各因素在综合得分模型中的系数

对步骤(1)中所得的各指标所拥有的三个主成分进行加权平均,注意利用的是初始特征值的方差百分比。
例如:指标UV在综合得分模型中的系数为
(0.46748.55%+0.32632.443%-0.37*17.641%)/(48.55%+32.443%+17.641%)=0.271

image.png
(3)确定各因素的权重系数

即,将各因素在综合得分模型中的系数进行归一化。
例如:指标UV的权重系数为
0.271/SUM(0.217+0.153+…+0.111)=0.202

image.png

最终,我们得到在这6项因素中,各因素所占的权重值。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多