分享

福特法则在水文径流序列分析中的探索

 GXF360 2017-11-11

福特法则在水文径流序列分析中的探索

胡友兵1 刘开磊1 吕燕翔2

(1.淮河水利委员会水文局(信息中心) 蚌埠 233001 2.山西省大同市水文水资源勘测分局大同 037000)

【摘 要】将统计学中本福特法则应用于水文径流序列分析,通过淮河干流息县、王家坝、鲁台子和蚌埠站研究表明:水文径流序列首位数字出现的概率值与本福特法则计算值相近,流域上游本福特法则适用性要大于流域下游。研究成果可用于指导水文径流资料分析工作,具有实用价值及参考意义。

【关键词】本福特法则 水文径流序列 “三性”分析

1 概述

流域水文资料质量分析是水文资料整编中的一项基础工作,水文资料分析是指对资料的可靠性、代表性和一致性进行检查论证,以使水文资料精度达到水文情报预报及各类建设和规划的使用要求,即通俗说的“三性”分析。

传统上“三性”分析偏重于对水文序列统计参数的特征分析,如序列均值稳定性、Cv值变化、频次分析等。一般来说,在没有大扰动源的情景下(如降雨、水库泄流等)流域水文过程一般较为平稳,其数值较小。当发生强降雨或上游水库泄流较大时,将出现涨水过程,呈现“起涨—快速上升—峰值—缓慢下降—平稳”的变化趋势。从时程上来看高值出现的跨度低于低值,即数字首位低值出现的概率大于高值。这种现象称为本福特定律或本福特法则。基于上述认识,本文将本福特法则引入水文资料径流序列分析中,从上游至中游依次选取淮河干流四个重要控制站作为典型断面进行检验分析,为水文数据质量分析探索一条新的思路。

2 方法介绍

本福特法则是指在一组直接获得、未经人工修改的N进位制数据中,首位数字出现的的概率可以近似用以下公式描述:

式中:i为整数且 i=1~N-1;p(i)为一组数字中首位数字为i的概率。如不加特殊说明,后文内容所提到的均为N=10(即十进制)的情况,首位数字(1~9)出现的概率如图1所示。

本福特法则认为在一组随机发生的数字当中,各个数字的首位存在一定规律,越小的数字出现的几率越高。对于一组平均增长的数据,由最初的数字N增长到另一个数字N+1起首的数的时间,必然比N+1起首的数增长到N+2,需要更多时间,所以出现率更高。从时程上来看,低位数字维持的时间跨度要大于高位数字。对于一段较长的径流序列,其稳定的低径流值出现的频率要明显大于涨水高径流值,符合本福特法则描述的变化特性。

图1 本福特法则示意图

图2 试验断面及径流记录数量分布图

3 试验断面

选择淮河洪泽湖以上流域作为试验流域,从上游开始依次选择息县、王家坝、鲁台子、吴家渡四个水文站作为代表站,以各站流量观测数据为分析对象,采用本福特法则分析数据分布规律。此外,为对比说明本福特法则的应用效果,以线性插值后的数据作为对照组进行试验。所选资料的起止年限均为1997~2006年,统计各站观测资料中不为空且大于1的记录。各水文站位置及径流资料的系列长度图如图2所示。

4 结果分析

为能够展示本福特法则在分析不同类型数据时的使用效果,该研究将同一站点的一类数据中首位数字出现的统计概率与本福特法则计算概率值绘制在同一张图上(如图3所示),并以RMSE(均方根误差)指标评价两类概率值之间差异大小。因为所选四个水文站点均为河道水文站,径流序列较为平稳、延续,因此在流量插补时可以选择采用简单的线性插值方法。水文站流量的直接观测记录简称为实测流量,为直接从数据库中提取的原始数据,默认不存在人为修改行为;线性插补后的流量序列简称为线插流量。

从图3中可以发现,流域上游息县、王家坝断面实测和线插流量序列与本福特法则概率曲线拟合较好,且实测流量拟合度要大于线插流量。流域中游鲁台子和吴家渡断面拟合程度稍差。在吴家渡断面出现了首位数字2概率大于1的现象,这是由于吴家渡站枯季多年平均流量在200以上,即该站稳定的低径流值首位数字2出现的概率要大于1。

图3 试验断面径流序列本福特法则概率计算分布图

通过比较上图中各站点原始与线插流量数据可知,线插后的数据偏离本福特法则的频率分布曲线更为明显,人为修改的痕迹可以很明显得反映在首位数字的频率分布情况中。从上游王家坝至吴家渡站,资料序列逐步变短,所需插值的数据越来越多,人为修改痕迹也变得更重,反映在首位数字的频率分布曲线上,就是线插后数据的频率曲线偏离本福特法则频率曲线越来越严重,这印证了本福特法则对人为修改行为的敏感性。

另一方面,比较各站原始流量数据的首位数字频率分布可知,上游至中游各站偏离本福特法则的幅度越来越大。虽然所分析数据均为原始数据,不存在人为修改的情况,但是也存在显著的人类活动影响流量观测值:(1)上、中游行蓄洪调度、水库调蓄行为,大致将各站流量量级限定在可控范围内;(2)从上游至中游各站基流量在实测流量中的占比越来越大。因此,各站实测流量首位数字所服从的频率分布,依照从上游至中游的顺序呈现着越来越严重的偏离现象。

总体上来看,无论实测流量还是线插流量序列,其首位数字出现的概率值均与本福特法则计算值相近。未经人工插补处理的实测流量序列,与本福特法则计算值近似程度更高。进一步来说,流域上游本福特法则适用性要大于流域下游。

5 结语

本福特法则认为长时间序列中首位数字低值出现的概率要大于高值,且随着数字的增大概率下降趋于平缓,这种现象反映了自然界中事物总是趋于一种低的能量状态。水文径流序列虽然变化复杂,涨落影响因子多样,但对其长序列首位数字频率统计发现,其变化仍然符合本福特法则。呈现流域上游较下游、实测序列较线插序列规律更为明显的现象。

基于该研究的结果,淮河流域从上游到下游各站数据受人为因素干预影响越来越明显,这也是与淮河中游洪水控制较多的实际情况相匹配的,进一步印证了本福特法则对流量数据质量分析中的适用性及敏感性。该研究成果对于相关的水文数据合理性分析工作,具有实用价值及参考意义■

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多