泊松模型的局限之一是缺乏预测零分平局概率的能力,本文解释如何对泊松模型进行调整让其作为判断足球平局公式,使其能够应对足球预测零分平局。 用来预测足球比赛得分的主要模型是泊松模型(或者它的变种),最直接的方法是为每支球队设置预期进球参数,然后相应地预测得分。 泊松模型总结如下:主队参数为联赛平均主场得分率乘以主队进攻因子和客队防守因子。前者根据访问球队的防守评级而对主场得分优势进行相应调整(防守实力越强,进球机会就越低),而后者则评估主队得分能力。客队预期进球得分率的评估方法类似,不过使用了客队得分因子和主队防守因子。 泊松模型的局限性 如同其他任何模型,泊松模型在预测足球比赛得分时也有某些局限性——即结果对于使用的参数中的改变很敏感。泊松模型还假设一旦预期进球参数设置好之后,每支球队的进球数都是互不影响的。尽管使用特定的防守和进攻评级对这一点有所控制,但是如果主队进了五球或者完全没进球,我们真的能预测在这两种情况下客队进五球的概率是一样的吗? 最致命的局限性是假设每支球队的进球得分变动等于预期进球数(泊松分布的功能)。有很多处理这个问题的聪明方法,比如过度离散(或者欠离散)泊松模型以及二元泊松模型,但是这些都不在本文的讨论范围内。这些局限性的组合效应之一是缺乏评估0-0平局的足球预测能力,这样的平局可能高于或低于泊松模型产出的结果。我的直觉是泊松模型倾向于低估0-0平局发生在那些有着高预期进球参数的球队身上的可能性。 实际上,经常在比赛中进很多球的球队得到0-0平局的机会要高得多,因为在比赛关键时机过去后仍然没人进球的情况下,他们可能会降低比赛节奏。反之,在比赛中经常得低分的球队在拿到首粒进球之前可能节奏更快。标准泊松模型无法捕捉到这一点,因此会过高预测0-0平局的机会。 如何缩小或扩大平局概率 调整0-0平局概率的一种方法是胀大或缩小此类平局的概率,并相应调整其他预测。这可以通过五个步骤来进行解释,我将在此使用一个简单的例子来解释。 第一步:计算每支球队的预期进球参数 为了不做过多的赘述,我们在此假设最后的平均进球参数分别为主队1.7和客队1.2(这些不过是随机的数字)。 第二步:计算每支球队进球的概率 在这里,我们使用方程式来计算进球数的概率分布,如下所示
第三步:计算比分的概率分布 现在我们可以将概率相乘,得出不同比分的概率。例如,0-0比分为18.3% x 30.1% = 5.5%的可能性。结果如下所示。请注意,这些相加起来不会满100%,因为存在其他比分的可能性(例如5-1)。我们可以补充说明其他比分的概率为3.7%。
第四步:计算0-0平局的膨胀参数 这一步中可能会渗入某些主观性。例如,假设过去的统计数据暗示0-0平局应该有10%的概率发生,因此我们需要将5.5%增至10%。 膨胀参数的计算方式:(0-0的假定概率)/(预测的概率)=(假定的概率)/(概率(0,0)) 使用符号α来代表它,我们得到:
这有力地表示我们增加了82%的零分平局概率。由于这是从5.5%增至10%,因此我们必须降低其他概率累积起来的概率的相同百分比,以使所有结果的总百分比为100%。 第五步:计算其他比分的参数 使用符号β来代表这个因子,我们可以使用等式:
在这里我们得到β=(1-0.1)/(1-0.055)=0.95 第六步:重新填写膨胀的比分表 现在我们终于可以重新计算不同比分的概率,只需将0-0概率乘以α,剩余其他概率乘以β。我们将得到以下结果,而其他比分的概率为3.5%。
我们学到了什么 我们在本文中通篇讨论了对传统泊松模型的调整,这种调整可以改变零分平局的概率。该模型可以扩展来应对任何比分的调整,只要所有结果的概率也得到调整以满足相加为100%的条件。 这确实增加了其他一些假设——假设的零分平局概率,并且所有其他概率都使用相同比率β作出了调整。尽管如此,它仍然可能是对于倾向低估/高估零分平局的传统模型的优秀改进。
|
|
来自: 昵称54571762 > 《文件夹1》