这篇文章一共会分为四个部分进行讲解。
一、认识数据 1.1 什么是数据?简单来说数据是一种量化事物的手段,就像身高、体重、三围一样,它们都是一个数字指标,代表了事物现实存在的客观情况。数据最大的特征就是客观性,无论我们是否触碰它,它就在那里。在面对海量数据的时候,身为产品经理的我们要更像一个「求知者」,如果我们希望在数据中找到答案,我们更应该带着一个「求证」的态度去读取,去分析,去解读。 1.2 数据与产品的关系数据可以用来帮助我们验证产品假设是否正确,也可以帮助我们发现产品的问题。 通常情况下,一个完整的数据需求包括:
这里举个例子说明下,网站注册流程功能的数据统计需求:
二、获取数据 2.1 网站的数据指标与分析工具2.1.1 数据获取工具免费的网站排名工具:Alexa、中国网站排名、网络媒体排名免费的网站检测工具:Google Analytics、百度统计、CNZZ网站分析 2.1.2 关键指标
网站的数据有很多,我们可以通过先对网站进行宏观的分析对网站有个大体的把握,避免一上来就陷入数据的细节中,通常我们可以通过回答以下几个问题来大体的了解网站:
注:在利用指标去评估版本迭代的效果时,尽量使用新用户的数据,因为老用户会存在忠诚度等因素影响数据。 我们在评估新版本的迭代的效果时,可以看以下几个数据指标
通过观察以上指标基本上就可以大概的判断这个版本改版的效果了。 2.3 电商类数据指标2.3.1 关键指标名词解释
我们前面说到,销售额是电商网站中最关键的指标,没有之一。销售额 = UV 转化率 客单价那我们接下来一个一个的分析这三个因素 1. 流量变化的因素 分析流量的变化就需要从流量的来源上来入手。 分析思路大致是,先按照终端细分,先看下PC端、App端、Wap端分别变化了多少,然后在细分对应的终端流量是从哪里来的。PC端和Wap端可以细分到媒体,App端又分Android端和iOS端,Android端可以从渠道包中来区分来源,iOS端可以用一些跟踪工具或者IDFA来跟踪。具体可以看下图: 流量分析 举例说明 2. 客单价变化的原因下面我们来看下客单价的公式 客单价 = 人均购买件数 * 件单价
客单价的变化经常会与促销活动有关系。如下图: 客单价变化因素 3.转换率增长因素 - 转化漏斗 正所谓一图胜千言,看下面这张图大家应该就可以明白了。 转化漏斗 首先解释下什么是UGC,UGC就是以用户创造内容为主的应用,比如博客,微博,朋友圈等UGC产品的关键指标就是「用户参与度」用户参与度指标
举个例子:轻博客的参与度指标
另外UGC产品还特别依赖于优质内容的产出,那如何去筛选优质内容了? 首先我们要对优质内容建一个评分模型,比如微博的优质内容模型为: 热度 = 转发 + 评论 + 点赞 然后可以对各个指标定义下所占比例,这样就可以凭借热度这个指标去筛选优质内容了。 三、分析数据 3.1 基本分析方法3.1.1 横向对比横向对比就是和自己对比。 举个例子,改版的App发布后,想看下改版后的效果,这个时候就需要用到横向对比了,和上一个版本进行对比。 横向对比 纵向对比就是和竞品对比。 举个例子,微信支付和支付宝在除夕这天的一些数据对比(数据纯属虚构): 纵向对比 象限法指根据数据中的(质量、数量等)的两个重要属性作为分析的依据,进行分类分析。 比如对App的渠道分析,我们可以用「质量」和「数量」两个维度来进行,如下图: 象限分析 交叉分析的主要作用就是从多个维度细分数据,它的作用主要是从中发现最为相关的维度来探索数据变化的原因。 举个例子,统计一款App的新增用户数,我们采取交叉分析法,把终端、时间和渠道三个维度结合到一起,如下图: 交叉分析法 AARRR是Acquisition、Activation、Retention、Revenue、Refer,这个五个单词的缩写,分别对应这一款移动应用生命周期中的5个重要环节,具体模型如下图: AARRR模型 那产品经理应该可以利用AARRR模型来做什么了? 它提供很好的精细化数据分析思路,能够将整个是数据链打通,而不会仅限于某个具体的指标。 下面我们举个具体的例子来说明: 某App通过渠道A引入了100000个用户,单个用户成本为3元。通过渠道B引入了50000个用户,单个用户成本为10元。 如果我们不通过AARRR模型来分析,这样就很简单的判断是渠道A效果会更好,但是我们如果通过AARRR模型来看。 渠道A的AARRR模型: ![]() 渠道A的AARRR模型 渠道B的AARRR模型 ![]() 渠道B的AARRR模型 通过上面两张图我们可以看出其实是渠道B的效果会更好一些的。 3.3 逻辑拆解分层框架什么是逻辑拆解分层框架? 对于一个产品来说,它的数据指标非常的多,对于产品经理来说,我们不可能时时关注每个指标,通知我们需要重点关注最核心的指标。 举个例子来说:
这里我们举个电商的例子,电商的核心指标是销售量,我们对销售量这个指标进行逻辑分层,得到下面这张图: ![]() 销售量的逻辑分层 得到这张图后,我们通过分析销售量的指标的变化,就可以更精确的去定位是什么原因的导致的了。 3.4 漏斗模型分析框架漏斗模型,就是从起点到终点有多个环节,每个环节都会产生用户流失,依次递减,每一步都会有一个转化率。 比如很典型的商品购买流程: ![]() 漏斗模型 我们通过这张图就可以很清楚的知道用户在哪个步骤流失的最多,然后我们就可以针对该步骤进行优化。 3.5 使用数据时需要注意的事项3.5.1 数据图形的欺骗我们先来看下下面这两张图: ![]() 7日活跃趋势图 ![]() 7日活跃趋势图 这两张图其实表达的数据是一样的,但是看第一张图会感觉活跃用户增长趋势比第二张图好很多。 那怎么避免这种问题了,答案是给这套曲线增加一个公式,用公式来表现曲线的斜率。 3.5.2 数据抽取样本的问题举个现实生活中的例子: 在2008年奥运会上,姚明的三分投篮命中率为100%,科比的三分投篮命中率为32%。 那么我们是不是说姚明的三分投篮命中率要比科比高了?显示不能这么说,因为那届奥运会,姚明只投了一个三分,科比投了53个三分。 决定样本量大小的因素有:
所以在抽取样本的时候,尽可能的多覆盖,尽可能的找差异程度大的用户。 3.5.3 数据被平均这里先举个例子说明下: 对于一个新推广的的网站: 网站平均访问时长:55秒;用户平均访问页面2.16个。 这个是不是就可以说明用户主动浏览其他页面,但是我们这时候看下页面浏览和访问时长的分布图: ![]() 页面浏览和访问时长的分布图 这个时候你就会发现你被平均数带到坑里去了。 那么问题来了,什么时候平均数可以代表整体的情况了? 答案是当数据为正态分布时,就可以用平均数代表整体的情况了。当数据的分布为长尾分布时,我们可以选取数据比较集中的部分进行分析。 ![]() 正态分布和长尾分布 当人们尝试探究两种变量(比如新生录取率与性别)是否具有相关性的时候,会分别对之进行分组研究。然而,在分组比较中都占优势的一方,在总评中有时反而是失势的一方。 下面举个具体的例子来说明下: ![]() 数据 当产品经理看到上面这组数据时,是不是就可以决定要先从电脑版开始开发了? 我们接下来再看另一组数据: ![]() 数据 从这组数据来看是不是和上面那组数据得到的结论完全相反了。 3.5.5 忽略沉默用户用户迫切需要的需求 != 产品的核心需求 有时候我们所听到的需求,或许只是少部分用户迫切需求,而大部分用户并不在乎。 举个微信的例子: 很多用户都反馈说为什么不给消息加个消息状态,这样我就可以知道对方有没有看我的消息了。说实话刚开始看到这个需求的时候,我就想到了陌陌和WhatsApp,他们都做了消息的状态功能。然后就想当然的觉得微信其实也应该加一个。 后来我看到这样Allenzhang的回答:
微信对人性的把握太精准了。 所以说很多时候我们要站在更高的角度去考虑问题,不能听到用户的声音的时候就立马做出决策,而忽略了产品大部分目标用户的核心需求。 3.5.6 过分依赖数据我们观察我们生活中的很多的伟大的产品都不是通过分析数据得出了。比如,当年汽车诞生的时候,我们通过分析马车的相关数据,只能得出用户需要一匹更快的马车。 所以说,产品经理还需要把自己的理性思维和感性思维更好的结合在一起。 3.5.7 错判因果关系什么是因果关系? 就是A的发生,导致了B的发生。比如醉酒驾驶导致交通事故,那么醉酒就是交通事故的原因之一。 什么是相关关系? 就是A和B两件事情的出现,都是出自同一个原因,数据上显示火锅消费高峰期和冰淇淋消费低谷期总是同一个阶段出现,而这两件事情都有同样一个原因,即天气变冷,气温下降。 有时候我们在分析数据时常常把相关关系错判为因果关系。 这里我们举几个现实生活中的例子:
所以说,我们在面对数据的时候要时刻保持独立思考的状态,要多问几个为什么,要多好奇心 。 四、利用数据 4.1 数据应用的场景4.1.1 需求层面需求一般有两个来源,一个是用户层面,一个是公司层面,数据在面对这两个方面的需求所起到的作用是不一样的,下面我们分别看下这两个层的需求来源。
数据驱动产品最重要的保持数据驱动产品的思维方式(具体见下图),可以看出,利用数据,产品可以不断的进行优化。 ![]() 数据驱动产品的思维方式 首先我们有一个好奇的心,保持自己的求知欲望。这些是引领我们前进的内在动力。我们在生活中就可以发现很多数据,如果我们有足够好奇心的话,其实可以发现很多有趣的问题的。 比如,分析在春节时候的自己朋友圈转发文章的阅读数、点赞数等一些数据。你会发现哪些文章的转发率高,自己朋友圈的一些特征等。 其次我们要有正确的数据驱动产品的思维方式。 然后我们要非常熟悉我们所在产品的业务,我们要重视数据,保存对数据的敏感程度。 |
|