分享

自提柜的销售促进作用分析——基于PSM模型 | Excel案例

 欧森0吴 2018-06-24

 写在前面

大家好!本期案例是购食汇系列的第二期,在本案例中我们将对自提柜的销售促进作用进行分析。感谢四川大学商学院的江雨凡同学在案例制作中的巨大贡献,还要感谢狗熊会PPT金牌制作人翟神的鼎力相助。

本期是购食汇系列案例的第二期,和一般生鲜电商相比,购食汇的独特之处在于它在部分小区配置了具有温控功能的生鲜自提柜。当用户下单后,平台会在用户预约的时间配送商品并且储存在用户填写住址附近的自提柜中,用户可以下班后或在自己安排的时间提取商品。

举个例子,生活在绵阳的小明在早高峰的公交车上决定晚上吃一顿水煮牛肉,他在购食汇上下单了牛肉、豆芽、莴笋和粉丝。选择配送到他所居住的华丰社区的自提柜,并且标注送货时间是下午5点。当天晚上7点,辛劳工作一天的小明下班回家,顺道从自提柜中取出他购买的食材。新鲜的食材成就了一道美味的水煮牛肉,这是小明一天工作最好的慰藉。相比之下,如果小明居住的小区没有自提柜,小明下单的食材被送到社区物业,经过两个小时,下班回家的小明收到的很有可能是蔫了的豆芽和微微发臭的牛肉。

自提柜对上班族来说是个福音,不仅节约购买食材的时间和体力,而且对所购买食材的新鲜程度也有了保证。除此之外,自提柜本身也可以作为一种实物广告。既然自提柜有这么多好处,我们不禁要问:配备自提柜,是否可以显著提高用户的登录和购买呢? 

为此我们选择了购食汇在绵阳市区,2015年5月1日至2017年11月21日的用户数据共5000条进行分析。其中2541条为周边无自提柜的用户数据,其余2459条为周边有自提柜的用户数据。

探究自提柜的设置是否会增加用户的登录次数和购买金额,这属于干预效应分析的一类问题,为此我们采用倾向匹配得分模型PSM(Propensity Score Matching)

听起来很学术的样子,那么如何通俗的理解PSM模型呢?举个例子,假设小明居住在高新区,15年注册购食汇,附近没有自提柜,我们想要知道,如果他家附近有自提柜了,他购买的金额和登录次数会不会更多。但我们首先面临一个问题,究竟是因为有自提柜的影响,所以用户登录和购买较多。还是由于用户本身的差异,所以产生登录和购买情况的差异。此时可以通过寻找一个居住在高新区,15年注册购食汇,家附近有自提柜的小明2号,并比较小明和小明2号的登录次数和购买金额是否有差别。也就是说当我们想研究自提柜是否对登录次数和购买金额产生影响时,首先需要找两个在其他各方向长得差不多的个体,如果此时二者在登录次数和购买金额上依然产生了差别,那么可以认为这种差异是由是否有自提柜这个因素造成的。这样的方法有一个专业的名词,即PSM。

具体的,实施PSM方法可以从以下三个步骤进行。首先采用logistic回归的方法为每一个样本计算一个匹配得分。在这里以是否有提柜作为因变量,配对变量为自变量,构建一个逻辑回归模型,将估计出的逻辑回归的线性拟合值作为每一个样本的匹配得分。接下来,通过匹配得分将有自提柜的样本和没有自提柜的样本一对一进行匹配。可以选择不同的配对方法,本文选择最邻近匹配方法,以倾向得分为依据,在无自提柜组中向前或向后寻找最接近有自提柜样本得分的对象,并形成配对。最后,在获得匹配之后,将两组数据在订单数、消费金额和登录次数三个方面进行对比。通过倾向匹配得分配对后,可以认为这两组样本在除了自提柜这个特征外,其他属性基本一致。此时如果对比的变量具有显著差异,那么可以认为是由自提柜这个因素产生。PSM是一个比较成熟的方法,很多的统计软件里都有相应的包可以实现,本文的PSM分析是通过R软件实现的。

经过匹配后总共生成了2459对,以登录次数为例,我们发现相较于无自提柜的用户,有自提柜的用户登陆次数显著较高。在购买金额和订单总数方面,我们也得到了相似的结论。

因此通过本分析,可以认为自提柜确实具有促进销售的作用。与无自提柜的用户相比,附近有自提柜用户的平均订单数高1.93个,平均消费总金额高81.48元。

本案例基于PSM的分析属于比较浅显的,用于计算得分的变量越多越能得出更加准确的匹配,而在我们的分析中,用于计算得分的变量比较少,在未来可以尝试加入更多的变量。在实际的业务中,我们也许会经常碰到诸如本文的一些场景,希望简单的PSM分析能够帮助到大家。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多