【原】R语言POT超阈值模型在洪水风险频率极值分析中的应用研究

拓端数据 2022-09-19 发布于上海

展开全文

全文下载链接：http:///?p=15301

在本文中，结合POT模型的洪水风险评估能够从有限的实测资料中获取更多的洪水风险信息,得到更贴近事实的风险评估结果,能为决策者提供更多的依据,从而使决策结果更加可靠实用。

相关视频

对于这些同样面临挑战的人，我希望这个博客将有助于简化工作。

案例POT序列在47年的记录期内提供了高于74 m 3 / s 阈值的47个峰值。

我们的目标是将概率模型拟合到这些数据并估算洪水分位数。

我从获取了每次洪水的日期，并将其包含在文件中。有趣的是，最早的洪水流量是1943年，而最后一次是1985年，是43年的记录，而不是47年。这是因为1939年至1943年的洪水都小于74 m 3 / s的阈值。

首先计算这些数据点的绘制位置。

T给定排放超标之间的平均间隔（年）
R是POT系列中的流量等级（最大流量是等级1）
n是数据的年数。

请注意，这是记录的年数，而不是峰值数。

同样，重要的是要认识到，方程式1对POT系列的作用与年度系列不同。让我们看一个显示这种差异的示例。考虑以下情况：我们根据47年的数据分析了POT系列的94个峰。在这种情况下，最小的峰的等级为94。重复间隔为：

这大约是半年或6个月，这似乎是合理的（47年中有94个高峰，因此平均每年有2个高峰，平均相隔约6个月）。

将绘图位置解释为年度超出概率将得出以下结果：

也就是说，概率大于1，这没有意义。因此，我们不能使用绘图位置公式来计算阈值峰值序列中的数据的AEP。取而代之的是，方程式1的逆可以解释为EY，即每年的预期超出次数。

ARR示例将指数分布拟合为概率模型。

为了计算L2，我们使用QJ Wang（Wang，1996）的公式


L2 <- function(q){  q <- sort(q)  n <- length(q)  0.5*(1/choose(n,2))*sum((0:(n-1) - (n-1):0)*q)}

qi从最小到最大的顺序是流量（POT）
n是流的数量

L2 = 79.12

指数分布的参数可以用L矩表示。我们使用的是广义帕累托（GP）公式。

对于指数分布：

这些参数估计值的置信区间可以使用bootstrapping计算得出。

Beta的95％置信区间是（37.4，89.4）和（120.6，244.7）。参数之间的相关性约为-0.5。参数的不确定性如图1所示。


param_errors_df %>%ggplot(aes(x = V1, y = V2)) +geom_point(size = 0.1) +scale_x_continuous(name = 'beta') +scale_y_continuous(name = bquote('q'['*'])) +stat_ellipse(colour = 'red') + # 95% 置信区间theme_gray(base_size = 7)

图1：参数的不确定性。椭圆显示置信限度为95％

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：拓端数据 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

拓端数据

关注对话

TA的最新馆藏

【视频】多元线性回归模型原理讲解与R语言实例
Python之LDA主题模型算法应用
TMA三均线股票期货高频交易策略的R语言实现
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
数据报告分享|SPSS基于多元回归模型的电影票房预测
【视频】LSTM模型原理及其进行股票收盘价的时间序列预测讲解|附数据代码

喜欢该文的人也喜欢更多

热门阅读换一换