分享

新型组合模型在铁路客运量预测中的应用

 GXF360 2017-06-29
新型组合模型在铁路客运量预测中的应用

新型组合模型在铁路客运量预测中的应用

冯冰玉1,鲍学英1,王起才1,董朝阳2

(1.兰州交通大学土木工程学院,兰州 730070; 2.兰州中川铁路有限公司技术装备部,兰州 730000)

摘 要:客运量是用来测算交通运输业所承担的工作量,反映了运输业为国民经济和人民生活服务的数量指标,准确的客运量预测直接影响到铁路项目的经济效益评价及铁路交通组织安排。根据客流量数据的特点,提出新的组合预测方法,构建线性时间序列灰色GM(1,1)模型和考虑客流量影响因素的非线性遗传算法优化BP神经网络模型。最后结合新建兰州至中川机场铁路项目及调查数据进行客流量的预测研究,并将组合模型预测结果和单一模型相比,得出新型线性和非线性组合模型预测精度更高,取得了满意的效果,为客流量的预测提供了一种新的工具。

关键词:铁路运输;客运量预测;组合模型;灰色理论; BP神经网络;遗传算法

1 概述

铁路是现在交通运输体系的主要运输方式。我国铁路面临的主要问题是运输能力远不能适应国民经济和社会发展的需求。为了提高铁路投资的准确性,在建设的前期必须对运量进行可靠地预测[1]。随着计算机的进步,不断涌现出新的理论与方法。常用的定性预测方法是德尔菲(Delphi)法;定量预测方法有指数平滑法、回归分析法、神经网络法、弹性系数法和灰色系统法等[2]。其中灰色理论和神经网络相对灵活,在客流量应用中最为广泛,然而基于时间序列的灰色GM(1,1)模型假定客流量是一种线性变化的系统,考虑客流量影响因素的BP神经网络模型则假定客流量是一种非线性变化的系统。因此,针对客运量这个复杂的大系统来说,提出建立新型线性和非线性组合预测模型,并将模型运用到兰州至中川城际铁路客流量预测中,使得单个模型得到有效的发挥,尽可能地提高客运量预测精度,为交通运输规划提供一种新的依据。

2 铁路客运量组合预测模型

2.1 线性灰色GM(1,1)模型

灰色系统理论是1982年由我国学者邓聚龙教授创立的,是一种研究少数据、贫信息不确定性问题的新方法[3]。灰色理论的预测模型中GM(1,1)是最典型线性动态模型[4-5],主要应用于时间序列预测。

x(0)为原始时间序列[6],共有n个观察值,即X(0)=(x(0)(1),x(0)(2),…x(0)(n)),对x(0)进行一次累加生成(1-AGO),生成新的数列x(1)

(1)

其中:

(2)

x(1)建立灰色微分方程,即GM(1,1)模型

(3)

(4)

式中,z(1)(k)为紧邻均值生成序列。

最后,做一次累减还原,得原始数据的拟合值和预测值

(5)

2.2 非线性GA-BP模型2.2.1 BP神经网络原理

BP神经网络(Back Propagation Neural Network)是一种按误差逆传播算法训练的多层前馈网络[7],由输入层、隐含层及输出层组成[8](图1)。该神经网络算法流程可分为BP神经网络的构建、训练、预测三步骤。

图1 三层BP神经网络结构

BP网络通过拟合非线性函数的特点确定网络结构,具体步骤如下。

(1)权值、阀值初始化

根据输入输出数列(XY),确定输入层节点数n,隐含层节点数l,输出层节点数m,初始化输入层、隐含层和输出层连接权值wijwjk,初始化隐含层阀值a,输出层阀值b,给定学习速率和神经元激励函数[9]

(2)计算隐含层输出Hj

(6)

(7)

式中,f为隐含层激励函数;l为隐含层节点数。

(3)计算输出层输出Ok

(8)

(4)计算误差ek

(9)

式中,O为网络预测输出值,Y为网络期望输出值。

(5)权值和阀值更新

(10)

(11)

(12)

(13)

式中,η为学习速率;ek为预测误差。

(6)判断指标是否满足精度要求,若不满足,返回步骤2重复计算。

2.2.2 遗传算法优化BP神经网络

BP神经网络具有很强的学习能力和适应能力,但网络训练需要较长的时间,易陷入局部最优解,遗传算法(Genetic Algorithms,GA)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型[7],具有寻找全局最优解的特点,采用遗传算法优化BP网络初始权值和阀值可改进神经网络的性能[10],形成具有极强的解决非线性问题的GA-BP模型。

遗传算法将需要求解的问题采用实数编码成染色体的形式[11],计算每个染色体的适应度fi,根据适应度值选择优良的个体以pc的概率进行交叉,使得信息得到交换,再以pm的概率进行变异,开拓问题解的新空间,直到在种群中找到满意的个体,达到要求的收敛精度时算法结束。最后,将遗传算法得到更好的初始权值和阀值赋给BP神经网络。

2.3 组合模型

综合考虑客流量预测的特点,将不同的预测模型进行合理的组合,构建新型线性和非线性组合模型[12-13],既能够具备时间序列的线性特征,又能够获取影响因素的非线性特征。数学表达式为

(14)

式中,Lt为组合模型中的线性结构;Nt为组合模型中的非线性结构。

首先,通过线性灰色GM(1,1)模型去拟合客运量时间序列的线性部分,则线性模型的预测残差只包含非线性部分[14],再用影响客流量因素的非线性GA-BP模型去拟合残差Et,得到非线性数据特征t。最后,客流量新型组合模型的预测值为t,如下式

(15)

(16)

式中,tt时刻线性灰色GM(1,1)模型的预测值;tt时刻非线性GA-BP模型的预测值。

2.4 铁路客流分担量

采用效用理论的Logit模型进行铁路客流的分布预测[15],可以得出每种交通方式分担的客流量。其模型的基本形式为

(17)

式中 Pk——k种交通运输方式的分担率;

Uk——出行人选择k种交通方式可以观测到的效用。

3 实例研究

为满足兰州机场及中川新区客流集输,新建兰州西至中川机场铁路项目,本研究选取2006—2014年铁路沿线车流量数据,建立线性灰色GM(1,1)模型,再利用Matlab7.0对灰色残差序列建立非线性影响客流因素的GA-BP模型,并对2015年客流量进行预测,最后运用Logit模型,采用铁路客流分担的方法,得出兰州西至中川机场铁路运量,见表1。

表1 2006~2014年兰州西至中川客流量统计 万人

年份200620072008200920102011201220132014客运量168.26246.37328.24447.56549.80663.80796.48941.761109.26

3.1 构建客运量预测组合模型

对2006~2014年原始数据建立线性时间序列灰色GM(1,1)模型,即x(0)(k)-0.19z(1)(k)=237.86,进行客流量预测得t,并将预测结果与原始数据相比较,得到残差序列Et,见表2。

表2 2006~2014年灰色客流量预测值及残差值 万人

年份200620072008200920102011201220132014实际值168.26246.37328.24447.56549.80663.80796.48941.761109.26预测值168.26297.92361.06437.59530.34642.74778.97944.071144.16残差序列051.5532.82-9.97-19.46-21.06-17.512.3134.9

影响铁路客流量的因素有很多,本文主要考虑可量化的因素,通过查阅相关文献,选取具有代表性的兰州市人口(万人)、人均收入(元)、国民生产总值(亿元)3个因素[16-17]。人口的多少与客流量成正比例关系,人均收入的提高增加了出行的意愿,国民生产总值反映了当地经济发展的水平。收集2006~2014 年兰州市各项指标数据,具体参见表3。对灰色模型的残差序列Et建立非线性影响因素的GA-BP模型。

表3 影响客流量的指标数据

年份人口/万人人均收入/元生产总值/亿元2006302.009418.00638.472007309.0010271.18732.762008317.0011676.77846.282009332.1812761.00952.982010361.6114061.841100.392011368.3615952.571360.032012374.2918442.761564.412013385.4320767.001776.282014396.9923466.712042.72

对BP网络输入输出数据预处理,采用Matlab自带归一化函数mapminmax,其形式为

[inputninputps]=mapminmax(input_train);

%训练输入数据归一化

[outputnoutputps]=mapminmax(output_train);

%训练输出数据归一化

遗传算法计算个体适应度,通过选择、交叉、变异得到最优的初始权值和阀值。采用Matlab7.0编程建立具有一个隐含层的BP神经网络,对遗传算法搜索到的最优解进行训练,客流量影响因素作为神经网络的输入,客流量残差序列作为网络输出Et。遗传算法中初始种群M=30,交叉概率Pc=0.25,变异概率Pm=0.1,进化迭代次数为100。BP神经网络中构建网络函数为newff,输入层节点n=3,输出层节点m=1,隐含层节点l=5,即得到非线性数据特征t,如表4所示。

3.2 组合模型预测结果

根据公式(16),将线性模型预测结果和非线性模型预测结果进行合理组合,可得最终组合模型各年客流量,并将预测结果与单一模型进行比较,见表5。

表4 GA-BP模型残差序列预测值 万人

年份200620072008200920102011201220132014残差序列051.5532.82-9.97-19.46-21.06-17.512.3134.9预测值^Nt051.6732.98-9.84-20.08-20.03-17.892.3835.7

表5 各模型预测结果比较 万人

年份实际客流量GM(1,1)模型组合模型计算客流量相对误差/%计算客流量相对误差/%2006168.26168.260.00168.260.002007246.37297.9220.92246.250.052008328.24361.0610.00328.080.052009447.56437.592.23447.430.032010549.80530.343.54550.420.112011663.80642.743.17662.770.162012796.48778.972.20796.860.052013941.76944.070.25941.690.0120141109.261144.163.151108.460.07

从计算结果可以看出,组合模型的预测结果平均相对误差为0.06%,线性时间序列GM(1,1)平均相对误差为5.05%,线性和非线性组合模型的结果精度大大高于GM(1,1)模型预测精度,这说明线性和非线性组合模型预测相对误差小,效率高,具有很好的预测性。

根据所建立好的组合模型,兰州市每年人口增长率按3%,人均收入增长率按13%,GDP增长率按15%计算,得出2015年影响客流量各因素的数据。将时间序列数据和影响因素数据导入已建好的组合模型中,得出2015年兰州西至中川铁路沿线客流量预测值1 335.62万人。

3.3 铁路客流分担量

通过组合模型预测出兰州至中川机场沿线客流量,根据兰州至中川公路客运交通费和《旅客出行意愿调查表》[18],从时间和出行费用两个方面计算,运用Logit模型,得出铁路分担率约为52%,即兰州至中川机场城际铁路2015年客流量为694.52万人。

4 结论

铁路客运量是铁路建设和行车组织安排的重要依据,本文提出了新型组合模型,巧妙地将线性时间序列GM(1,1)模型和非线性影响因素的GA-BP模型有效地结合起来,充分利用客运量线性和非线性的数据特征,并将组合模型应用于兰州西至中川沿线客运量预测中,采用铁路分担率的方式,将铁路沿线交通小区的公路客流量转换为正在修建兰州至中川机场的铁路客流量。最后,结果表明组合模型相比单一模型具有更高的预测精度,表现出更好的性能,具有较好的应用价值。

参考文献:

[1] 谢小山.基于遗传算法和BP神经网络的铁路客运量预测研究[D].成都:西南交通大学,2010.

[2] 王生昌,白韶波,张 慧.公路客运量预测方法的比较[J].长安大学学报:自然科学版,2005,25(5):83-84.

[3] 刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].3版.北京:科学出版社,2010.

[4] 侯丽敏,马国峰.基于灰色线性回归组合模型铁路客运量预测[J].计算机仿真,2011,28(7):1-3.

[5] Yuan J B, Li X. Study on highway passenger volume forecast by the method of the GM (1, 3)-Markov chain model[J]. Journal of Transport Science and Engineering, 2011,27(4):68-72.

[6] 张庆平,赵峰,王思华.基于灰色理论和 PSO 的牵引供电系统可靠性研究[J].铁道标准设计,2014,58(12):121-122.

[7] 刘 冰,郭海霞.Matlab神经网络超级学习手册[M].北京:人民邮电出版社,2014.

[8] Wang Z, Wang Y, Jia L, et al. The application of improved BP neural network in the prediction of railway passenger volume time serial[J]. China railway science, 2005,26(2):128-131.

[9] 王小川,史峰, 郁磊,等.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

[10]吕霁.基于遗传算法优化神经网络的房地产评估模型及实证研究[J].计算机科学,2014,41(11):75-77.

[11]何祥卫.基于遗传算法的铁路纵断面优化研究[J].铁道标准设计,2014,58(6):15-16.

[12]Chase J, Boyer F, Rodgers G, et al. Linear and Nonlinear Seismic Structural Impact Response Spectral Analyses[J]. Advances in Structural Engineering, 2015,18(4):555-570.

[13]Abdollahzade M, Miranian A, Hassani H, et al. A new hybrid enhanced local linear neuro-fuzzy model based on the optimized singular spectrum analysis and its application for nonlinear and chaotic time series forecasting[J]. Information Sciences, 2015,295:107-125.

[14]张毅敏.线性与非线性的组合模型在铁路客运量预测中的应用研究[D].成都:西南交通大学,2014.

[15]豆飞,贾利民,秦勇,等.铁路客运专线模糊k近邻客流预测模型[J].中南大学学报 :自然科学版,2014,45(12):4423-4429.

[16]LI M T,JI X F,ZHANG J, RAN B. FA-BP Neural Network-Based Forecast for Railway Passenger Volume[J]. Applied Mechanics and Materials Vols, 2014,641:676-677.

[17]Yan X, Li J. Analysis on predict model of railway passenger travel factors judgment with soft-computing methods[J]. Journal of Industrial Engineering and Management, 2014,10(1):100-114.

[18]鲍学英,王起才,董朝阳.兰州至中川城际铁路客运量分担率计算及应用[J].铁道运输与经济,2015,37(3):55-58.

A New Combination Model for Forecasting Railway Passenger Volume

FENG Bing-yu1, BAO Xue-ying1, WANG Qi-cai1, DONG Zhao-yang2

(1.School of Civil Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China;2.Technical Equipment Department, Lanzhou Zhongchuan Railway Co., Ltd., Lanzhou730000, China)

Abstract:Passenger traffic is used to measure transportation workload, reflecting the transportation service level for the national economy and people’s living index. Accurate forecast of passenger traffic directly affects the evaluation of economic benefits of railway project and railway traffic organization arrangement. According to the characteristics of the traffic data, this paper puts forward a new combination forecast method, the establishment of the linear time series grey GM(1, 1) model and the nonlinear genetic algorithm to optimize the BP neural network model that considers the influence factor of traffic. Finally, the combination model is illustrated by Lanzhou to Zhongchuan airport railway new project and the survey data. The results are compared with the single model, concluding that the new model of the linear and nonlinear combination forecasting is higher in accuracy with satisfactory results and ideal for predicting passenger traffic.

Key words:Railway transportation; Passenger traffic volume prediction; Combination model; Grey theory; Back propagation neural network; Genetic algorithms

收稿日期:2015-05-14;

收稿日期:2015-05-19

作者简介:冯冰玉(1990—),女,硕士研究生,E-mail:fengbingyu12345@126.com。

文章编号:1004-2954(2015)12-0006-04

中图分类号:U293

文献标识码:A

DOI:10.13238/j.issn.1004-2954.2015.12.002

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多