分享

大数据:数据分析驱动竞技体育

 wsgmail 2022-12-08 发布于上海

这届卡塔尔世界杯上,有几项新的技术上马。首先就是上届世界杯就开始使用的 VAR(Video Assistant Referee)系统。

那时候,这个系统主要用来重新审视禁区中是否存在犯规;而这一届世界杯,通过增加更多的摄像头,通过更好的图像识别技术,VAR 已经可以做到半自动的识别越位了,准确率远远高于边裁配合主裁的人工模式。

世界杯往往是很保守的。这个系统其实早在 2017 年就应用于德甲和意甲中了。只从技术角度看,足球比赛是否还需要两个边裁,现在都已经是很大的疑问了。因为当初之所以设置边裁,就是因为足球场面积过大,一个裁判在场内跑,注意力和视野的角度顾忌不到那么多点,但现在,传感器、几十上百个摄像头配合发达的图像识别,远比人眼更敏锐。

在比赛判罚上使用新技术,其实是数据驱动体育赛事的大背景下涌现出的一个方面。在此之前,已经有太多球队通过新的运作方式超越了原有的竞争对手。

这期《科技参考》,我们就来看看大数据是怎么重塑竞技体育的。

高阶数据的出现

体育中运用大数据,主要是两个方面,一个是训练运动员,另一个是帮助商业决策。

用于运动员训练这方面,今天已经分化出两个特别的职业,一个是数据分析师,一个是视频分析师,在 NBA 里也被称为“视频协调员”(Video Coordinator)。

以篮球为例,随着数据的细化,现在已经有很多平台根据公开内容推出了高阶数据统计。而仅仅 10 年前,这种深度加工处理的数据,对每支球队来说都还是自己费时统计出来的、不公开的,比如效率值(PER)、胜利贡献值(WS)、进攻/防守效率、失误率、场上/场下区别(On/Off Split)。

这些数据挨个解释起来太麻烦,因为很多都涉及不少计算公式,我们就以最后一个——场上/场下区别——为例来简单说说。因为它很有代表性,表征的是一个球员上场与不上场的情况下对球队会产生怎样的影响。

我们知道,球员的搭配是非常微妙的,如果只看那些得分、篮板、助攻高的球员,有的是虚高,有的是实高。虚高的意思是,整个球队的战术就注定担任那个位置的球员会有不错的数据表现,所以那个位置的数据亮眼是理所应当的,你就理所应当数据亮眼才对。但到什么程度才能视为理所应当?什么程度才能视为比理所应当还要更好呢?场上/场下区别(On/Off Split)这项统计就是表征这一点的。

比如,前雄鹿队的球员布兰登·詹宁斯(Brandon Jennings)就是一个被抓出来的反例。

仅从个人数据表现看,2012-13 赛季,他绝对是雄鹿队数据表现排第一的,放在任何其他球队也是当家球星。但对雄鹿队来说,他在场上的时候,雄鹿队每百回合被对手多得 4.4 分;而他不在场的时候,雄鹿队每百回合比对手多得 6.9 分。没他的时候反而能赢球,有他的时候全队输分,只他一个人得分。

一个球员是否适合一个战术系统,从这些高阶数据就能反映出来。詹宁斯其实就是一个在队里刷分但并不产生贡献的人,于是下一个赛季他就被卖到了底特律活塞队。

提供这些细分数据的公司,现在的盈利模式就是和球队合作,提供实时更新的高阶详尽数据。比如最著名的就是 Basketball-Reference。

数据分析师和视频协调员配合工作,加工处理的数据远不是某个球员单场平均多少分、几个篮板、几个助攻、几个盖帽之类的,而是类似下面这些统计数据——

平均 100 次攻击篮筐,这位球员上篮和跳投分别占比多少,平均 100 次攻击篮筐可以得多少分,上篮和跳投的成功率分别是多少,跳投时有百分之多少的情况下存在对方防守的干扰,命中率是多少,还有每 100 次防守让对手平均得多少分,甚至还会细分成对位防守和错位防守。

这些数据往往不能通过自动的方式统计出来。比如,哪次防守是对位的呢?对方的得分后卫和我方的得分后卫尽管在开赛前的名单上是固定的,但也有些比赛打着打着,教练让一个组织后卫改打得分后卫了。这只能靠有经验、懂篮球的人肉眼识别,然后做统计。这些就是队伍内部的数据分析师和视频协调员要做的工作。

数据分析师的价值

今天的比赛,越是专业,这些处理数据的人就越是重要。重要到什么地步呢?一个好的数据分析师会被各队抢着要。

比如,严元哲原来是一个普通的体育院校毕业的学生,毕业后本职工作是在一所私立高中当篮球教练,但自己业余时间建立了一个庞大的视频数据库,后来被当时还处于次级职业联赛的江苏同曦队选中。他加入后,球队成绩大幅提升,2014 年成功晋级顶级的 CBA 联赛。

更加专业的还有 NBA 费城 76 人队的数据科学家 Ivana Seric。她是个 1 米 88 的女生,毕业于新泽西大学数学系,博士阶段的研究方向是流体动力学。自从她加盟 76 人队后,通过数据分析改善了挡拆的进攻,赢得了总经理的信任。

目前,76 人队也是整个 NBA 三十支队伍中对数据分析最重视的球队之一,这支球队的战术、每年新人的选秀选谁,决策中占比最大的就是由数据分析团队给出的建议战术和建议人选。

还有香港东方足球队的主教练——陈婉婷,一听名字你就知道是个女生,没错,而且还是一个二十多岁的女生,她是那个球队的主教练。28 岁的她带着球队在 2016 赛季赢得了香港超级联赛的总冠军,而且在第二年的亚冠杯上与日本川崎队 1:1 打平。队里有一些男球员比她的年龄还要大。但她进入职业足球圈的身份是什么呢?数据分析师。此前几年,她一直是东方足球队的助理教练,职责就是数据分析。

此外,还有目前 NBA 热火队的主教练。他在 2007 年正式担任热火队主教练之前的 7 年,一直在这个球队担任视频协调员。

大数据的应用

正是因为个别队伍开始重视从海量数据中寻找规律,挖掘最大的问题、找出最大的优势,才使得球队竞技水准大幅提升。

而今天很多球队的数据分析部门已经开始把手伸向了其他球队。他们会派员工到现场录制每场比赛,就像分析自己队员那样分析其他球员,然后统计出对方某个战术执行的效率,再统计出过往交战球队应对此战术的打法和成功率。

这样的工作做细致了以后,甚至可以预测每场比赛的胜负结果。整个赛季下来,总的预测结果就能为下一年度的球员薪资、转会预算、队伍建设做更加精准的财务预算。

过去,有一些不健康的模式是这样运作的:只要成绩不行,就堆更多球星进来,于是球队工资总额是其他队伍的好几倍,但成绩依然只能维持中游,凭着感觉乱来就是会亏钱。

此外,数据还可以应用在某位球员出场和他的表现对观众入场人次的影响和对收视率的影响上。而这两个指标直接影响到球队最大的两个收入来源——门票收入和转播费收入。对数据把控的准,能做到精准的预测,就能给明星球员找到最合适的休息时间,他们在这些时间点轮休,既不会影响球队成绩,也不影响球队收入。这在从前的传统经营模式里是很难实现的。

当然,对这方面的数据应用更加上心的其实是博彩业。对于那些公司来说,它们赌的不是一场球的输赢,而是几十年如一日的猜输赢。以长期预测比赛结果为生的公司,一旦找到了一丁点比博弈对手更能准确判断输赢的手段,哪怕这个手段只能让他们的预测准确率提高 5%,那都是非常可观的利润。

我还记得 30 多年前北京国安队的主教练在赛前分析对手、布置战术的情景。公正地说,那时候教练的专业素养还不及今天一个比较出色的中学足球教练。那时候的赛前准备会更像是一种动员会,战术说了半天就是 4-3-3,谢峰右边路下底传中,周宁、杨晨中路抢点,高峰带球突破之类的。

而今天的竞技体育,尤其是商业利益渗透得比较深的竞技体育项目,缺乏了数据分析,那几乎就不可能是一支职业队伍了。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多