本篇内容为数据分析入门方法系列的第4篇,综合指标分析的思路,有需要回顾前三篇方法的,传送门在这里对比分析、分组分析、平均和交叉分析。 本文大概 2000 字 读完共需 6 分钟 之前提到的对比、平均、分组和交叉的分析思路,都是在单一指标下分析的方法。而综合指标评价法是建立在复杂数据情况下,将多个指标的转化为一个综合指标对某一特征进行总体评价,如人民的幸福程度、人才评价、用户活跃程度等,这种方法经常出现在行业报告中。 极光数据在2019年8月19日发布的APP流量价值评估报告中,就用到了综合指标分析方法。首先构造了流量价值这个综合指标,然后从四个维度:用户规模、流量质量、用户特征和产品特性分别选取相应指标。 权重是如何确定的、具体值是多少,我们就不得而知了,只能看到它的分析结果,下面的截图是分析结果的一部分,一二线城市流量价值较高。 一、综合指标分析法的步骤 综合指标分析说白了其实是我们自己造一个指标,但也不是凭空捏造,要说明具体来由及相关逻辑计算方法,即权重分配,整个过程符合常规逻辑即可。 找出要进行综合评价的所有相关指标,确定指标有几个原则需要注意:
【逻辑树模型】 在确定指标的过程中,其实我们用到了一个数据分析的思维方法,或者叫一个数据分析模型,那就是逻辑树。逻辑树模型是将一个问题层层分解,找到末端原因所在的一个方法,因其长的像一个树状的结构,所以叫逻辑树。如我们设置人才优秀程度的评定方法,第一层从基础能力、沟通能力、创新能力等5个方面来评价,第二层将涉及这几个方面的指标相互独立地罗列出来,逻辑树的关键在于找到末端原因
当确定好需要哪些指标以后,就将反映指标的数据填充进去。将每个人的相应指标下的打分结果(0-100分)填充进去。我们还可以直接求和计算其得分,图片中红色背景填充的为top3项。 依据历史经验,我们将赋予每个指标相应的权重,如下图所示,基础能力5%的权重,执行力35%的权重等,权重相加应为100% 对每行数据计算其加权后的值,再相加就得到了一个综合值,即图片中的权重得分。注意加权值的计算方式: 加权以后的综合值和不加权的值有什么区别呢,我们同样把加权以后的得分前3项标红了,可以看出来原本得分排名第三的李四因为在加权以后排不上前三了,区别就在于权重。 二、应用案例 上述人才优秀程度评定的例子是建立在数据在同一区间,也就是所有的打分都是在0-100分之间,图片所示的是更多的情况下,数据范围各不一致,假设我们要分析一个网站某一天的用户活跃程度,通过用户登陆网站次数、主流时间(秒)和点击量三个指标来得到一个综合值。 step1 数据标准化 如果不进行数据标准化,那么量纲较大的指标对结果的影响就大,量纲较小的指标对结果的影响就小,这种影响是应该消除的,所以,数据标准化,即将数据按比例缩放到一个特定的区间,便于后续比较和分析,常用的数据标准化的方法有0-1标准化和Z-score标准化。 0-1标准化,也叫离差标准化,是通过对一组数据最大最小值的线性变换处理,使之落在[0,1]区间内,对于一组数据,其0-1标准化后得到的新值的公式为:
其中,min为该组数据的最小值,max为该组数据的最大值,yi为标准化后的新值。 先对登陆次数进行标准化 同样对驻留时间和点击量进行0-1标准化。 step2 计算加权后的综合值 权重的确定方法就不细展开了,这里只是提供一种做法,当把登陆次数、驻留时间和点击量都标准化以后,就可以分配权重并得到一个新的综合值了。 step3 结果分析 对结果进行降序排列,就可以得到综合指标最高的top10的用户ID了,从而进行贴心的维护~ 方法不难,能用是真。最后,多看行业分析报告,能提高在分析方法上的觉悟能力。这个系列会写一些入门级的分析方法,工具的运用都大同小异,思维的不同决定个体的差异,希望大家能get到其中的奥秘。 提供入门级数据分析的学习路线规划,分享从Excel到统计学的干货。数据分析是一项技能,希望人人都能分析数据。 相关内容: SQL学习:MySQL入门 | 库/表/记录的增查删改 Excel分析方法:时间序列分析 | 回归分析 | 描述性统计分析 | 相关性分析 Excel图表:数据地图 | 数据透视表 | 5个基本图 | 13个进阶图 | 直方图 | 控制图 | 排列图 Excel函数:日期文本函数 | 查找引用函数 | if函数 | 统计函数 方法论:如何系统地学习Excel | 数据分析学习 | Excel相见恨晚的技巧 如果你觉得有用,请点击右下角 在看 哟 |
|