金融时序预测：状态空间模型和卡尔曼滤波（附代码）

taotao_2016 2020-01-15

展开全文

作者：arit Maitra

编译：1+1=6

前言

时间序列由四个主要成分组成: 季节变化、趋势变化、周期变化和随机变化。在今天的推文中，我们将使用状态空间模型对单变量时间序列数据进行预测分析。该模型具有连续的隐状态和观测状态。

状态空间模型

基于状态空间模型对问题进行了结构分析。该系列是由不同的组成部分，如趋势、季节、周期、变化以及解释变量和干预分别建模，然后放在状态空间模型中。

数据基于1986年以来的Schlumberger Limited历史数据。

在这里，为了方便计算，我采用了月（12个月）频率，你也可以尝试天（252天/年）的频率。

下面由密度和正态 QQ 图组成的分布图清楚地显示了数据分布的非正态性。

描述性统计：

平稳性检验（ADF）

stationary.test(df1, method = “adf”)
stationary.test(df1, method = “pp”) # same as pp.test(x)
stationary.test(df1, method = “kpss”)

数据归一化：

自相关函数（ACF）

确定不同时间lags的相关性是否趋近于0！

平稳性=高斯噪声和一个趋势=累积高斯噪声之和。

在这里，我们将通过查看每个信号的自相关函数来检查每个信号的平稳性特征。我们期望对于一个平稳信号，ACF 在每个时间 lag (τ) 时变为0，因为我们期望不依赖于时间。

我们在这里看到，平稳信号有很少的lags超过ACF的 CI。这种趋势导致几乎所有的lags时间都超过了置信区间。结果表明，ACF 信号是平稳的。但是，趋势信号并不是平稳的。平稳序列在均值水平附近有较好的方差，峰值是原始序列干预的证据。

我们将进一步分解时间序列，它通常涉及水平、趋势、季节性和噪声成分的组合。分解有助于在分析和预测期间更好地理解问题。

时间序列分解

对时间序列进行分解意味着将其分解为组成成分，这些成分通常是趋势成分和随机成分，如果数据是季节性的，则是季节性成分。分解涉及到将时间序列分离到这些单独的成分中。

我们可以对数据进行差分或对数变换来消除趋势和季节性。在许多统计和计量经济学应用的背景下，这些成分的知识具有潜在的重要性。趋势和季节的估计可以通过最大化残差均方差从差分序列中恢复，但是这并不像直接对分量建模那样吸引人。我们要记住，真实的时序从来都不是静止的。

在这里，我们将使用简单的时间序列移动平均平滑法来估计趋势分量。

df1SMA8 <- SMA(df1, n=8)
plot.ts(df1SMA8)

df1Comp <- decompose(df1SMA8) # decomposing
plot(df1Comp, yax.flip=TRUE)

我们看到，估计的趋势部分显示，从1997年的约9小幅下降到1999年的约7，然后从那时起稳步上升到2019年的12。

经季节性调整

df1.Comp.seasonal <- sapply(df1Comp$seasonal, nchar)
df1SeasonAdj <- df1 — df1.Comp.seasonal
plot.ts(df1SeasonAdj)

结构模型

结构时间序列模型是（单变量）时间序列的（线性高斯）状态空间模型。在考虑状态空间架构时，通常我们感兴趣的有三个主要方面：

预测，预测状态的后续值
滤波，根据过去和现在的观测值来估计状态的当前值
平滑，根据观测值估计状态的过去值

我们将使用卡尔曼滤波器来执行上述各种类型的推理。

过滤帮助我们在每次观察时更新系统的知识。平滑可以帮助我们根据整个样本来估计感兴趣的数量。

然而，你可能会问为什么我们不使用比结构模型更流行的ETS（指数平滑）模型。

ETS模型更具有一般性，因为它允许非线性（乘法成分）。
由于模型空间较大，ETS允许自动预测。
附加的ETS模型几乎等同于相应的结构模型。
ETS模型具有较大的参数空间。
结构模型参数总是非负的（方差）。
结构模型更容易推广（例如，添加协变量）。
使用结构模型更容易处理缺失的值。

基本结构模型（BSM）

结构模型具有使用简单、可靠性高等优点。给出了用极大似然法拟合时间序列结构模型的主要工具。

结构时间序列状态空间模型是将序列分解为若干个分量。它们由一组误差方差指定，其中一些可能是零。我们将使用一个基本的结构模型来拟合随机水平模型进行预测。构成状态空间模型的两个主要部分是：（1）可观测数据和（2）不可观测状态。

最简单的模型：

我们需要看到观测结果，因为状态被系统噪声隐藏起来了。观测结果是当前状态和一些额外的随机变化（称为测量噪声）的线性组合。观察结果是：

它实际上是一个ARIMA(0,1,1)模型，但对参数集有一定的限制。

局部线性趋势模型具有相同的测量方程，但在µt的动态性中具有时变斜率：

有三个方差参数。这里εt、ξt和ζt是独立的高斯白噪声过程。基本结构模型，是一个附加季节成分的局部趋势模型。因此，测量方程为：

其中 t 是具有动态性的季节性成分

训练、测试

模型拟合和预测

最好的做法是检查结构程序的收敛性。与任何结构化过程一样，我们需要有合适的初始点，以确保算法收敛到正确的最大值。

autoplot(training, series=”Training data”) +
autolayer(fitted(train, h=12),
series=”12-step fitted values”)

交叉验证

交叉验证是时间序列分析的重要步骤。

Fit model to data y1, . . . , yt
Generate 1-step ahead forecast ˆyt+1
Compute forecast error e ∗ t+1 = yt+1 − yˆt+1
Repeat steps 1–3 for t = m, . . . , n − 1 where m is minimum number of observations to fit model
Compute forecast MSE from e ∗ m+1, . . . , e ∗

Ljung-Box残差检验的p值为0.2131015>显著水平(0.05)；因此，不建议使用交叉验证的结果，因为模型显然不适合数据。

基本诊断

对任何统计分析进行的第一个诊断是检查残差是否与假定的错误结构相符。在单变量状态空间模型中，我们有两种类型的误差：过程误差(wt)和观测误差(vt)。它们不应该有时间趋势。

model.residuals

vt是t：vt = yt - Zxt - a时的数据与预测数据的差值

在状态空间模型中，xt是随机的，模型残差是随机变量。yt也是随机的，虽然与xt不同。模型残差随机变量为：Vt = Yt−ZXt−a

Vt的无条件均值和方差为0和R

checkresiduals(train)

卡尔曼滤波器

卡尔曼滤波算法使用了一系列随时间变化的观测数据，其中包含了噪声和其他误差，并产生了对未知变量的估计。这一估计往往比仅基于单一测量的估计更准确。使用卡尔曼滤波器并不假设误差是高斯的；然而，在所有误差均为高斯分布的特殊情况下，该滤波器给出了准确的条件概率估计。

sm <- tsSmooth(train)
plot(df1)
lines(sm[,1],col=’blue’)
lines(fitted(train)[,1],col=’red’)
Sm-tsSmooth (train) plot (df1) lines (sm [ ，1] ，col’ blue’) lines (fitted (train)[ ，1] ，col’ red’)

# Seasonally adjusted data
training.sa <- df1 — sm[, 1]
lines(training.sa, col=’black’)
legend(“topleft”,col=c(‘blue’,’red’, ‘black’),lty=1,
legend=c(“Filtered level”,”Smoothed level”)

x <- training
miss <- sample(1:length(x), 12)
x[miss] <- NA
estim <- sm[,1]+sm[,2]
plot(x, ylim=range(df1))
points(time(x)[miss], estim[miss],
col=’red’, pch=1)
points(time(x)[miss], df1[miss],
col=’blue’, pch=1)
legend(“topleft”, pch=1, col=c(2,1),
legend=c(“Estimate”,”Actual”))

plot(sm, main = “”)
mtext(text = “decomposition of the basic structural”
, side = 3, adj = 0, line = 1)

预测

sm %>%
forecast(h=12) %>%
autoplot() + autolayer(testing)

可以看出，BSM模型能够很好的提取季节成分。你可以在这里试验基于SMA的分解（如前面所示），并比较预测精度。

动态线性模型与卡尔曼滤波

动态线性模型（dlm）是状态空间模型的一个特例，其中状态误差和观测分量是正态分布的。这里，卡尔曼滤波将用于：

状态向量的过滤值。
平滑状态向量的值和终值。
预报提供了未来观测和状态的平均值和方差。

我们必须在拟合dlm模型之前定义参数。参数分别为V、W（分别为测量和状态方程的协方差矩阵）、FF和GG（分别为测量方程矩阵和过渡矩阵）、m0、C0（状态向量的先验均值和协方差矩阵）。

然而，在这里，我们开始dlm模型写一个小函数如下：

我们考虑了一个带有dlm的局部水平模型一个多项式dlm（一个局部线性趋势是一个二阶多项式dlm）和一个季节分量12。检查MLE过程的收敛性是很好的实践，而不是最佳实践的一部分。

我们还应用了卡尔曼滤波和平滑器。

由此可见，dlm模型的预测精度相当好。过滤和平滑在时序中几乎是一起移动的，彼此之间的差别不大。这里忽略了季节因素。预测时序和原始时序非常接近。

在这里公众号普及一下R中的dlm包：它是模块化的，因此你可以自由地构建具有多个组件的模型，例如，你可以指定具有季节性组件的线性趋势模型。

总结

状态空间模型有多种形式，是处理大量时间序列模型的一种灵活方法，并提供了处理缺失值、似然估计、平滑、预测等的框架。单变量和多变量数据均可用于状态空间模型的拟合。

参考资料

1、Durbin, J., & Koopman, S. J. (2012). Time series analysis by state space methods. Oxford university press.

2、Giovanni Petris & Sonia Petrone (2011), State Space Models in R, Journal of Statistical Software

3、G Petris, S Petrone, and P Campagnoli (2009). Dynamic Linear Models with R. Springer

4、Hyndman, R. J., & Athanasopoulos, G. (2018). Forecasting: principles and practice. OTexts.

2020年第14篇文章

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： taotao_2016 > 《文件夹1》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

taotao_2016

关注对话

TA的最新馆藏

常用的多传感器数据融合方法
很多人学不好“微分几何”，不是因为数学不行，而是选错了路径
素数，是如何统一“数学王国”的？这背后有让人“下跪”的联系
人类最早的数学欲望，解方程，膨胀了几千年，形成了一个数学帝国
什么是最小二乘？
脑启发的人工智能：全面综述

喜欢该文的人也喜欢更多

热门阅读换一换