预测准确度的统计

东西二王 2019-10-01

展开全文

预测准确度有多种统计方法，这里介绍常用的两种。

第一种是绝对误差百分比，亦即文献中常出现的MAPE[1]。这个指标说起来挺拗口，计算起来其实很简单：实际值减去预测，取绝对值，除以实际值，得到百分比，再把多期的百分比平均就是了。这个值很直观，但也容易误导：当实际值非常小，特别是接近0时，这一百分比可能很大。解决方案是设定上限，比如绝对误差的百分比不超过100%。

当然，有人或许会问，为什么是跟实际值比，而不是预测值？这是因为你的预测对象是实际值，你想跟它越近越好——你的目的是“击中”实际值，而不是预测值。那要比较的话，当然是跟实际发生的比较了，否则就成了“虚对虚”的数字游戏。

第二种是均方差，亦即文献中经常提到的MSE [2]。这是给每期预测和实际值的差值平方，然后再平均。平方的好处是放大极端误差：误差小了我们往往可以应对，比如设置安全库存，适当地赶工加急；害死我们的是极端误差——预测太低的话，安全库存很容易被击穿，导致高昂的赶工加急成本；预测太高的话，则容易造成大量的积压，以及由此而来的呆滞库存。

给误差平方，就是加倍“惩罚”那些超级误差，凸显那些极端虚高或虚低的预测值，也是我们应该重点避免的对象。如图1，6月份、10月份的绝对误差最大，我们通过平方，加倍“惩罚”这样的极端误差，最终反映在较高的12个月的平均误差（均方差）中。

预测准确度的统计

图1：均方差示意

均方差并不能直观地体现预测的准确度。比如均方差是4436究竟意味着什么，谁也说不清。不过“不怕不识货，就怕货比货”，在比较不同预测方法时，这一参数却非常有用——均方差越小，表明预测模型越准确。所以，均方差最小化是优化预测模型的重要考量。需要注意的是，均方差最小的时候，绝对误差百分比等其他预测准确度指标并不一定最小；反之亦然。

在评判预测模型好坏上，绝对误差的百分比挺直观，但因为其统计上的问题，往往会误导；均方差是个更好也更常用的评估指标，但是不够直观。不过，人们做决策，靠的不是“识货”，而是“比货”——两个预测模型放到一起，一个的均方差是3.1，另一个的是7.2，你不用是个博士都知道哪个模型更准确了。

对于绝对误差百分比的误导，我们拿一个具体产品的例子来说明，如表 1。

对这个产品，第一种预测方法是指数平滑法，平滑系数为0.3（指数平滑法的细节我们后面讨论）；第二种预测方法是移动平均法，13周移动平均。基于需求历史，我们复盘1到13周的需求预测；然后跟每周的实际值来比较，计算每种方法每一周的误差，算出每一周的绝对误差百分比、均方差；最后13周平均，得到每种预测方法的平均误差。

预测准确度的统计

表 1：预测准确度的计算示例

如果按照绝对误差的百分，移动平均法优于指数平滑法：指数平滑法的误差为53%，而移动平均法为47%，后者更小。但从均方差来判断，结论正好相反。怎么办？我们回归到预测误差，看两种预测方法下，实际的误差对供应链的潜在影响。

如图 2，移动平均法（实线）的误差明显比指数平滑法（虚线）大，表现在多个极端值上，上下变动幅度更大，给供应链执行的挑战更大。相反，指数平滑法的实际误差更小，变动也更小，相对均匀地正负相间。显然，指数平滑法是个更好的方法，这也表现在其均方差值更小上。

预测准确度的统计

图 2：两种预测方法的误差图

在学术研究中，鲜有例外，都是用均方差来评判预测准确度。在英文文献里，MSE是均方差的缩写，全称是MeanSquared Error。只要你读预测模型方面的英文著作，MSE是注定不会错过的。我能理解，在实践中，因为通俗易懂，很多时候我们还是用百分比；但在预测方法的择优上，均方差是个更靠谱的度量方法——你得相信那么多的教授、博士们用这种方法，自然是有其原因的.