分享

“大数据杀熟”到底用的是什么算法模型,如何监管?|大数据杀熟|算法模型|亚马逊|大数据|公众号

 群先 2022-03-30
今天就和大家聊聊“大数据杀熟”这个非常有热度的话题,开头先发个老新闻,在2021年4月7日,也就是上个月发生的事情;
唯品会、京东、美团、饿了么、每日优鲜、盒马鲜生、携程、去哪儿网、如祺出行、滴滴出行等10家互联网平台企业代表签署《平台企业维护公平竞争市场秩序承诺书》。
备注:上述引用和图片来自广州市市场监督管理局公众号
01
偶像Amazon
大数据杀熟这个事情最早是起源于亚马逊Amazon,Amazon最早通过互联网给美国人销售书籍和音像制品,也是电子商务开创者,他们就和当年的雅虎Yahoo一样,在互联网初期阶段是无数人心中被无比崇拜的偶像,当时在我心中Amazon网站就有白袍甘道夫的气质。
大概在20年前,也就是2000年的时候,我还是个大学生(暴露大叔的年龄了),Amazon就第一次尝试了“差别价格实验”,通俗点讲就是大数据杀熟。Amazon对68种畅销DVD进行试验,主要是根据自己顾客的购买历史记录、潜在用户的个人属性以及上网行为进行分析,尝试进行差别化定价,例如:《TiTitus》DVD新用户报价是22.74美元,老用户则是26.24美元。
结果没过多久,Amazon老用户发现自己被坑了!这就不得了啦,我这么忠实的老用户你居然坑我!在广大美国人民的口诛笔伐之下,CEO贝索斯(也是某届首富)就出来道歉了。而且还给杀过的熟客,退还了差价。最终的结局就是Amazon发现大数据杀熟在美国没有适合生长的土壤,最后以失败告终。
不得不说我们的互联网商家学电商鼻祖Amazon这个“坏”的地方学得可真快!十年后,大数据杀熟遍地开花,天猫、京东、滴滴、携程、美团、饿了么、去哪儿.......数不清了,而且是杀熟问题频频上热搜!
这在经济学中被称为“价格歧视”。
02
价格敏感度模型PSM
为了能更多地了解大数据杀熟的底层逻辑,我特意找了一些写得比较好的技术算法文章进行了阅读,真的是受益匪浅,我今天就通俗的翻译翻译。
其实大家杀熟搞钱的办法也没有想得那么复杂,大数据算法主要的基础模型就是PSM(Price Sensitivity Measurement)模型。
这个模型是70年代由Van Westendrop所创建,其目的在于衡量目标用户对不同价格的满意及接受程度,说得通俗点,就是从顾客可接受的产品价格范围中进行定价,即能让顾客满意,还能兼顾一下企业利益的最大化。本来就是个双方你情我愿的事情,顾客主观上觉得价格能接受,就买了,你企业把价格定得高,我也买不起,你的产品也只能放到橱窗存灰;反过来,企业把价格定得太低,也赚不到利润,真正掏得起钱的顾客还觉得你的东西可能是假货呢。所以PSM算法最终的目的是为了双赢,其实是好事情,结果在互联网上这就成了套路。
PSM的具体实施方法:
首先PSM模型对产品价格先进行定性研究,形成价格阶梯表,最低的价格和最高的价格一般差距在三倍。例如:一件T恤,从40块~120块形成一个价格区间。然后开始搞市场调研,通过自己的网站、公众号、小程序等等各种渠道对自己具有代表性的顾客做统计调查,只要回答我四个问题:这件T恤在多少钱的时候,你认为太便宜、便宜、贵、太贵,收集这四个问题的回答数据。这就形成了样本数据。当然了,被调研的样本数越大,效果越好了!
其次,根据模型算法对样本数据做曲线统计,就会得到一个四条曲线和四个交点,如下图所示:X轴是价格区间¥40~¥120,Y轴是累积百分比0-100%,也就是在产品在某个价格上对应四个问题的回答人数占比。
那么就成了P1、P2、P3、P4四个交点。分别代表:
P1(贵和太便宜)P2(太贵和太便宜)P3(便宜和太贵)P4(便宜和贵)
最终结果是:P1~P3就是可接受的价格范围,P2就是最优的价格点。
备注:为了说明问题,网上找了上面这张图,比较模糊,实在没合适的了,大家凑活着看吧。
好了,有了P1~P3可接受的价格范围的这么一个价格区间,我们就可以悄无声息得开始杀熟了!因为作为顾客,无论是在P1点还是在P3点,大概率都是能接受定价的。那么到底给谁的定价更接近P3,给谁的定价又更接近P1呢?这就是优惠券该干的事情了!其实优惠券的本质就是在定价范围内确定哪些顾客的实际支付金额更接近于P1或者P3。不要认为你拿了优惠券你就是沾了平台多大的便宜,因为平台迟早要让你还的。
这就是平台大数据进行的第二步操作,用户画像,什么是用户画像呢?其实就是给用户打标签,技术上叫大数据标记,所以大家在商家的大数据平台里面就好像被无数个标记扎得满脸都是的标记点,这就是所谓的用户画像。
大数据杀熟中的用户画像主要是判断顾客是对价格极度不敏感到极度敏感的一个区间内,你在哪个位置,商家当然希望自己的顾客都是对价格极度不敏感了,这样按照统一P3定价,一定会赚得盆满钵满。
那到底怎么才算是对价格极度不敏感的顾客?说白了,就是对平台忠诚的用户,已经建立起了对平台具有粘性和信任感的用户。而建立这种信任感的方式有很多,其中优惠次数、购买次数都是主要衡量标准。反过来看那些潜在的新客户,他们的忠诚度是最低的,所以平台算法就会给这些新顾客按照接近P1的定价,就是多发优惠券了,吸引新顾客成为忠实的顾客。那么说到这里,大家就能明白商家为什么一定要杀熟了吧!
对于用户画像的具体技术就不多说了,改天专门写一篇聊大数据的用户画像。只是注明一下:调查样本数据的PSM曲线绘制很简单,做一个统计图曲线就够了。但是基于PSM的用户画像就需要使用大数据技术来解决了,通过不同的用户交易数据和用户行为数据进行批处理,主要用到的技术就是通过列簇数据库对各项交易和行为指标的海量存储,例如HBase提供聚合统计数据集,再通过批处理技术求出各项统计值百分比,然后累加计算,获取用户的价格敏感度。例如:Spark进行敏感度指标聚合处理。
03
我们该如何监管
说回广州市场监管局把这些互联网大厂们都叫来发联合声明,证明政府已经很重视了,但是让一群狼只是发誓以后不吃羊肉了,这是行不通的,因此需要有效的监管!
目前的大数据杀熟技术很简单,通过上述的大数据算法模型和批处理就能将用户标记为哪个定价群体,就算以后不在每次价格区间上攫取利润,很大概率也会产生更复杂的算法,生成很多更隐蔽的办法。
因此我一直觉得建立一个监管大数据平台的平台很重要,也这是建立一个监管商家大数据平台行为的大数据平台,这来自于我曾经工作中研究过的互联网医院监管平台设计方案中提取出来的思路,互联网医院的各种在线诊疗行为需要汇聚到政府医疗监管部门的大数据平台进行在线问诊违规事件分析与监督。
要是针对大数据杀熟如何监管的问题进行建言献策的话,我们的市场监管部门也需要建立这样一个平台:对各个商家曾经发生过的消费记录进行数据二次采样,进行异常交易的监管分析,也就是市场监管行为从实物样本检查检验,又增加了一个新的监管模式——大数据样本采集并检查检验!
最后从客观上讲,大数据杀熟只是大数据时代利用科学算法的一个很小的负面情况,其实在大多数情况下大数据技术都是在造福于我们的,我们总是需要这些商家平台为大家的生活提供更加便利的出行、旅游、美食、购物、娱乐、学习、就业等。
结束语:大数据其实和土地一样是最基本的资产和资源,是人类生产和生活的根本源泉,若与大家行为相关息息相关的数据,说到底还是需要我们共同的监督。
(END)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多