“你是个好人,但我绝不会接受一个连热门口红品牌色号都分不清的好直男。” 自古以来,直男和口红,就是无法共存的个体,站在科学的角度,他们可能永远无法分清楚多如繁星的色号。最怕他们精挑细选之后,选出了他们最满意而女孩们闻风丧胆的——死亡芭比粉。 小Z作为一个做数据分析的直男,有必要让数据来说话——谁说直男就不懂口红色号。 他攥紧了拳头暗暗发誓:“哥要用数据来找到热门的口红品牌和HOT色号!”
但口红用残酷的现实啪啪打醒了他。 不同的品牌,甚至同一个品牌的不同系列,就算颜色看起来一毛一样,色号也是不同的。 “没关系,那我就先找出热门品牌,再分析不同品牌的热门色号!” 小Z早已百折不挠。 “淘宝(包括天猫)是走量最大的平台,那这次分析就从淘宝入手吧。” 热门口红品牌初体验 说干就干,小Z先在淘宝搜索“口红”,按销量排序,明确第一步目标:先收集TOP200产品的标题、收货人数(这里不完全是销量,是30天内确认收货的人数,这个数据和评价结合效果更好)、价格、店铺名称和地址。 (之所以只拿下TOP200,是因为他在电商浅耕多年的直觉:一个销量可观的行业,TOP200产品的特征已经能够代表行业的趋势了。) 通过产品详情页,可以得到关于品牌的信息: 如果按照销量排名来看品牌热度,难免有些单纯走量的品牌跻身前10,所以,后面的分析主要基于金额排序: 1、近30天TOP10品牌出炉,MAC以14.96%的市场占有率独占鳌头,YSL、纪梵希紧随其后。不难看出,前10个品牌累计占据了66.35%的市场份额。更进一步,20%的品牌占据了78.89%的收货额,二八法则可谓诚不欺我。 2、从平均价格来看,热门品牌可以分为三个梯队,第一梯队是高端线:纪梵希、YSL、阿玛尼、DIOR和雅诗兰黛,平均价格都在270以上;MAC以136元的平均价格独占第二梯队;第三梯队则是亲民品牌,ZEESEA、完美日记、稚优泉与美康粉黛,平均价格不超过50元。 至此,热门品牌和价格梯队划分完成,下面就是死磕不同品牌的色号了。 不同品牌的热门色号 这一步的操作,小Z决定分细一点,围绕数据爬取——清洗——分析的流程来进行。 1 数据爬取 所有关于商品色号的信息,都藏在商品评论里:
小Z决定从高、中梯队抽取每一个品牌的爆款(TOP1)产品,进行评价抓取。(毕竟是送妹,先放过亲民线品牌) 小Z先网罗了纪梵希、YSL、阿玛尼、DIOR、雅诗兰黛和MAC官方旗舰店爆款产品: 再分别爬取之,最终拿到合计10953条评价,还有买家昵称、评论时间以及我们最喜欢的色号信息: 2 数据清洗:
“如果无差别的统计色号,万一,有一款谁买谁骂的色号在统计中排名靠前,而我又向旁友们推荐了这款色号!!!这可是犯罪啊!” 小Z作为一个严谨的数据分析师,做色号之前先对评价进行清洗: 1、简单去噪。发现评价中有部分“此用户没有填写评论”,这一类无意义的评价必须剔除(其实还有一些是评价模板,旁友们自己尝试的时候可以细化,这里只是思路,暂不展开)。 2、对每条评价情感打分。然后只留下偏正向(积极)的评价,再统计色号。 经过清洗之后,10953条评价还剩9116条,看来口红绝大部分评价都是偏正向(炫耀)的。 3 数据分析 1、不同品牌色号数量分布: 从爆款产品色号数量来看,MAC可谓全面,评论中竟然涉及到50个色号。随后是DIOR的35个色号,YSL、纪梵希、雅诗兰黛色号数量比较接近,都在21左右。阿玛尼则比较高冷,只有15个色号供选择。 但色号数量只能看一个总览,各品牌色号集中度是一个什么样的情况呢? 2、各品牌色号集中度: 通过各品牌TOP3色号占比和累计占比来分析色号集中度。 YSL、阿玛尼、雅诗兰黛TOP3色号累计占比非常之高,达到了90%左右,其中阿玛尼和雅诗兰黛以一个爆款色号俾睨天下,他俩TOP1色号占比高达73%+,YSL算是两驾马车并驾齐驱。 MAC和纪梵希集中度在72%+,仍是依靠TOP1色号这个ADC的强大输出控场;DIOR呈现出百花齐放的态势,TOP3色号累计占比仅57.05%,TOP1、TOP2色号分布均匀,消费者在色号选择方面较为自主和独立。 3、最热门色号推荐: DIOR的999 MATTE,MAC的CHILI,YSL的N°1正宫色,阿玛尼的405番茄红,纪梵希的306还有雅诗兰黛的420#13玫瑰豆沙色。 “结论如此一目了然,以至于不用再多分析了。”小Z流下了两行激动的泪水。 现在,他终于知道5.20应该送女朋友什么口红,唯一的问题,就剩下......先找个女朋友! 小Z用他的实力证明,就算是直男,只要掌握了数据分析能力,也可以读懂女人心。 小到口红、衣服,大到用户行为调查、投资风险评估,有数据的地方,就一定会需要数据分析 |
|