分享

R语言POT超阈值模型在洪水风险频率极值分析中的应用研究

 拓端数据 2022-09-19 发布于上海

全文下载链接:http:///?p=15301


在本文中,结合POT模型的洪水风险评估能够从有限的实测资料中获取更多的洪水风险信息,得到更贴近事实的风险评估结果,能为决策者提供更多的依据,从而使决策结果更加可靠实用

相关视频

对于这些同样面临挑战的人,我希望这个博客将有助于简化工作。

案例POT序列在47年的记录期内提供了高于74 m 3 / s 阈值的47个峰值。

我们的目标是将概率模型拟合到这些数据并估算洪水分位数。

我从获取了每次洪水的日期,并将其包含在文件中。有趣的是,最早的洪水流量是1943年,而最后一次是1985年,是43年的记录,而不是47年。这是因为1939年至1943年的洪水都小于74 m 3 / s的阈值。

首先计算这些数据点的绘制位置。

  • T给定排放超标之间的平均间隔(年)

  •  R是POT系列中的流量等级(最大流量是等级1)

  •  n是数据的年数。

请注意,这是记录的年数,而不是峰值数。

同样,重要的是要认识到,方程式1对POT系列的作用与年度系列不同。让我们看一个显示这种差异的示例。考虑以下情况:我们根据47年的数据分析了POT系列的94个峰。在这种情况下,最小的峰的等级为94。重复间隔为:

这大约是半年或6个月,这似乎是合理的(47年中有94个高峰,因此平均每年有2个高峰,平均相隔约6个月)。

将绘图位置解释为年度超出概率将得出以下结果:

也就是说,概率大于1,这没有意义。因此,我们不能使用绘图位置公式来计算阈值峰值序列中的数据的AEP。取而代之的是,方程式1的逆可以解释为EY,即每年的预期超出次数。

ARR示例将指数分布拟合为概率模型。

为了计算L2,我们使用QJ Wang(Wang,1996)的公式


L2 <- function(q){ q <- sort(q) n <- length(q) 0.5*(1/choose(n,2))*sum((0:(n-1) - (n-1):0)*q)}
  •  qi从最小到最大的顺序是流量(POT)

  •  n是流的数量

L2 = 79.12

指数分布的参数可以用L矩表示。我们使用的是广义帕累托(GP)公式。

对于指数分布:

这些参数估计值的置信区间可以使用bootstrapping计算得出。

Beta的95%置信区间是(37.4,89.4)和(120.6,244.7)。参数之间的相关性约为-0.5。参数的不确定性如图1所示。


param_errors_df %>%ggplot(aes(x = V1, y = V2)) +geom_point(size = 0.1) +scale_x_continuous(name = 'beta') +scale_y_continuous(name = bquote('q'['*'])) +stat_ellipse(colour = 'red') + # 95% 置信区间theme_gray(base_size = 7)

图1:参数的不确定性。椭圆显示置信限度为95%


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多