分享

数聊丨你知道吗,数据分析能猜对歌手和听众的心思

 CDA数据分析师 2022-12-01 发布于北京


 CDA数据分析师 出品  

编辑:Sally

现代人离不开音乐。心情好要听歌,心情不好也要听歌;早起通勤要来一首振奋人心的歌,今天能早点下班更要来点音乐加成快乐;跑步要听点带节奏的,扫街更要左手一杯咖啡、右手来回切换网易云,漫步在洒满阳光的小道上——开心极了。不管在哪个场景,戴上耳机,意味着短暂地和身边世界保持一定距离,沉浸于自我营造的舒适环境里,“管你纷杂世界车水马龙,我是我自己的主宰”。

音乐世界是个庞杂多样的宇宙系统,我们每个个体遨游其中,专注于最吸引自己的那一片星光。由于音乐本身具有舒缓身心、放松情绪等心理效应属性,所以一想到“听音乐”这件事,大众的普遍认知或关键词多集中于“浪漫”、“天气晴”、“宇宙”或“星河灿烂”等宏观的情绪表达。然而感性的背后,其实更是理性架构的搭建。

01 民谣歌手,都在唱什么?

优质产品的打造需要依靠强大的数据分析能力,这是显而易见的。而随着互联网时代的发展,数字音乐产品的功能越来越强大,许多人也依托数据分析技术,针对产品或功能做了许多有趣的数据性分析。这些分析实验,又能进一步反作用于产品更了解用户心理,完善产品体系。

知名数据分析博主超级王登科曾做过一个实验,他选取了约30个风格迥异、受众不同的民谣歌手和乐队,包括赵雷、周云蓬、逃跑计划等,并设置了包含汪峰、窦唯、朴树、反光镜等风格不同的乐队在内的对照组,先爬虫抓取了歌手们按热度排名前50的歌,得到了小100个装满歌词的文件后,对当下中国民谣歌手的歌词内容进行了情绪分析。

王登科对歌词进行爬虫抓取

在对歌词进行自然语言处理后,王登科对各位民谣歌手进行了情绪、季节、城市、生活态度等方面的分析,其中有意思的是,他对歌词中出现“昨天”、“今天”、“明天”等的频率进行了统计分析,发现这些现代游吟诗人们,至少是活在当下的,“明天”出现的次数要远多于“昨天”,也就是说,无论曲调和主旨是否带有“浅吟流浪”、“困于当下”的意味,民谣歌手们依旧是对未来寄托了无限希望的。

在王登科的实验中,民谣歌手们忧愁又积极着

大数据能够指导21世纪的文艺青年更好地追求美好生活,也能让产品更精细地了解用户喜好和需求。通过机器学习模型和逻辑回归,数字音乐平台能更精准地预测一首歌究竟更符合哪位用户的需求。

02 我的偏好,是可以被猜到的吗?

美国的一位程序员以自己和一位朋友的Spotify歌单为样本,利用scikit-learn来训练机器学习模型,数据集由15列和1074首歌组成,包含程序员自己的563首及朋友的511首歌曲,在进行R语言分析以后,得出了自己和朋友不同的听歌喜好特征。

根据Spotify描述,与音频特性相关的一些歌曲特性(注:所有特性的值为0.0-1.0)

在数据集的15列中,他采纳使用了Spotify官方描述中与音频特性相关的部分,通过特征分析,得出了自己的歌单器乐音乐多(器乐性和原声性为显著特征),而朋友的歌单更具活力(呈舞蹈性和心理效价性)的结论。

二者歌单特征差值,表示二者喜好差异显著

随后,他利用音频特性的标准偏差来检视自己与朋友的歌单是否具有多样性,得到自己听的歌曲音频特性的标准偏较高,也就是更具有多样性这一结论。

二者音频特性的标准偏差

有趣的是,他通过自设的方程,将歌单是否“无聊”与活力性、舞蹈性、节拍和音量等四个特性相结合,来验证朋友对他的评价:“你的歌单很无趣!”,数字不会撒谎,得出的结论确实是,他的歌单比朋友的要无聊,他很可能会讨厌在派对上听到自己的音乐。

“无聊”值在数据集中的分布情况

方程式:boringness = loudness + tempo + (energy*100) + (danceability*100)

最后,在细致介绍对用户歌单属性的数据化分析之后,他利用逻辑回归模型,来试验能否通过机器学习预测一首歌应属于谁。他把机器学习定义为监督学习的子域,使用系统学习的数据集模型的任务,在这个学习过程中,算法寻找最优的数学函数。因此,当系统学习数据时,它应该能够利用学习过程中所学到的知识来推断或预测一组新数据的类别,检测结果显示,模型的精准度达到82%!

03 数据分析让音乐平台更了解用户

这种基于用户行为偏好的数据分析逻辑正在被广泛应用于各类音乐产品中,产品需要对用户音乐偏好深入探究后匹配相应的个性化内容以引流和提升用户粘性,如目前数字音乐市场的巨头之一:网易云音乐,依靠其强大的产品逻辑,整合音乐、社交、商城等多种功能,为用户打造了全品类的音乐生态圈,而这些都不是网易云最吸引人之处,其最强大的用户吸引力在于,根据用户听歌画像精准匹配私人曲库,并利用评论功能营造同圈层用户共鸣氛围,从而最终提升用户产品使用感和留存率。

网易云音乐样式

“音乐+行为+精准匹配“的模式对于打造用户品牌是极为有效的,因此这样的范式正在线上音乐平台中不断推广,各品牌也在其中深挖创新形式。如国内市场上另一音乐平台巨头QQ音乐,依托其强大的版权库和音质技术,在主打”粉丝经济“的基础上,通过大数据精准匹配用户歌手偏好与入驻艺人,同时利用腾讯系庞大的平台资源,不断扩充艺人资源,打造艺人与用户间的粉丝圈层,从而获取有效用户。而这其中的关键环节,就在于利用数据分析技术来实现用户行为的数据化及和平台现有资源的匹配,从而形成产品逻辑的有效实现。

QQ音乐的特点:海量歌手版权+精准匹配粉丝技术

数据分析之道,看似复杂又遥不可及,但其实沉淀并应用于生活每一个细小甚微处,数据分析思维能够帮助解决许多日常难题,同时能让我们更理性地思考问题,正所谓道之所道,其意深远也。

参考资料:

[1]https://ask.hellobi.com/blog/spuerwdk/6336

[2]https://zhuanlan.zhihu.com/p/47937148

[3]github.com/juandes/spotify-audio-features-data-experiment

[4]https://www.woshipm.com/evaluating/3267530.html

 

点这里👇关注我,记得标星哦~

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多