船舶交通量的BP神经网络马尔科夫预测模型

吕鹏飞+庄元+李洋+杨坤






摘要:为提高船舶交通量的预测精度,在BP神经网络的基础上结合马尔科夫预测模型建立一个新的预测模型.采用通过长江九江大桥的月度船舶交通量数据进行模型训练、验证和预测,求出相对残差值,将相对残差的前8项归一化后划分为3个状态,利用马尔科夫预测模型修正BP神经网络的预测值.该新模型将BP神经网络的相对残差值区间从[-12.9%,12.3%]降低至[-9.9%,5.4%].该模型能提高船舶交通量的预测精度,用于预测船舶交通量是可行的.
关键词: 船舶交通量; BP神经网络; 马尔科夫预测模型
中图分类号: U692; TP183; O211.62
文献标志码: A
Abstract: To improve prediction accuracy of the ship traffic flow, a new prediction model is established based on BP neural network combined with Markov prediction model. The month data of ship traffic flow crossing the Jiujiang Yangtze River Bridge are used to do the model training, verification and prediction. The relative residuals are calculated, the top 8 relative residuals are divided into 3 states, and Markov prediction model is used to correct the prediction values by BP neural network. The relative residual interval of BP neural network is improved from [-12.9%, 12.3%] to [-9.9%, 5.4%] by the new model, which shows that the new model can improve the prediction accuracy, and is feasible for the prediction of the ship traffic flow.
Key words: ship traffic flow; BP neural network; Markov prediction model
0 引 言
船舶交通量的預测为航道的规划、设计和船舶通航管理提供基础性依据[1],准确预测船舶交通量是海上交通控制和诱导的关键.船舶交通量预测模型大多借鉴道路预测模型,其中灰色模型[23]、神经网络模型[45]、支持向量机模型[68]和组合模型[1,9]是预测船舶交通量常用的模型.
马尔科夫过程因其无后效性常被用于道路交通量、需水量、用电量、股票等的预测.QI等[10]提出一种隐马尔科夫模型对高速公路高峰期的交通量进行短期预测.刘宗明等[11]在灰色预测理论的基础上,对随机波动大的残差序列进行马尔科夫预测.孔垂猛等[12]将建立的灰色马尔科夫预测模型运用到短时交通量数据的预测中,预测结果较好.景亚平等[13]建立了基于马尔科夫链修正的组合灰色神经网络城市需水量预测模型,其预测结果优于灰色神经网络及各单一预测模型的预测结果.何鑫等[14]用马尔科夫链方法预测全国年发电量趋势.WANG等[15]建立了模糊神经网络马尔科夫预测模型预测股票指数.
学者们通常将灰色理论与马尔科夫链相结合以提高船舶交通量预测精度.船舶交通量的大小与天气、货运量、海况等因素密切相关,因此船舶交通量的变化趋势必然不会呈现指数规律.灰色模型适用于具有较强指数规律的序列,只能描述单调的变化过程,并不适用于非单调摆动发展序列或饱和的S形序列.BP(Back Propagation)神经网络是人工智能网络中的一个经典模型,因其具有很强的非线性映射能力和自主学习能力备受各行各业研究者的青睐.本文在利用BP神经网络预测船舶交通量的基础上,结合马尔科夫性质对波动较大的预测值序列进行修正,从而提高船舶交通量预测精度.
1 预测模型
1.1 BP神经网络预测模型
BP神经网络于1986年由RUMELHART和MCCELLAND提出,是一种按误差逆传播算法训练的多层前馈网络.神经元是神经网络的基本单元,是一个多输入单输出的非线性原件.神经元输出值除受输入值影响外,还受神经元内部因素的影响,因此在神经网络建模中通常还需设置阈值.对神经网络进行训练时,通过不断调整阈值的大小可以使预测值与实际值的残差最小,从而提高模型精度.最常用的神经网络结构包括输入层(Input layer)、隐层(Hidden
1.3 BP神经网络马尔科夫预测模型
BP神经网络马尔科夫预测模型的建立步骤:将训练数据输入到BP神经网络预测模型中,计算出预测值与实际值的残差;利用黄金分割法将相对残差值划分为若干状态后,根据第1.2节马尔科夫性对预测值进行修正.BP神经网络马尔科夫预测模型建立流程见图2,具体步骤如下.
(1)建立BP神经网络模型,归一化原始样本数据;
(2)用原始样本数据序列中的前3个数据预测第4个数据,依此类推,得到重组数据后,对其进行训练、验证和预测;
(3)将预测值与实际值比较,求出相对残差值,归一化后进行状态划分;
(4)根据1步状态转移频数求出1步状态转移概率矩阵;
(5)根据CK方程求出k步状态转移概率矩阵;
(6)用马尔科夫过程修正BP神经网络预测结果.
1.4 模型适用范围
船舶交通量可以理解为单位时间内通过某一水域的船舶实体数,它能够在一定程度上反映该水域的拥挤程度和危险程度.
它是航运基础设施建设规划的主要依据,其预测结果的合理性、准确性、可靠性直接影响投资和效益.通常按照一定的时间跨度对船舶交通量进行预测,一般有短期(短时)、中期和长期预测等3种.任何一种预测模型或方法,都不可能对所有时间跨度的预测全部适用.短期船舶交通量数据具有时间序列非线性的特点,虽然BP神经网络具有非线性映射能力,可以以任意精度逼近任何非线性连续函数,从而求解内部机制复杂的问题,但是智能程度不高,仍存在许多未解决的问题.同时,马尔科夫预测模型不擅长处理非线性时间序列.因此,BP神经网络马尔科夫预测模型适用于中长期船舶交通量预测.
2 实例验证及数据分析
以翟久刚等[5]统计的长江九江大桥观测线月度船舶交通量数据为基础进行船舶交通量预测.以相邻前3个数据为训练样本预测第4个数据的方法重组33组样本数据,见表1.取前18组数据作为网络的训练数据,后15组数据作为验证和预测数据.
2.1 BP神经网络结构及参数设置
设置输入层神经元数量n=3,输出层神经元数量l=1,则根据式(2)可得隐层神经元数量m=4,这就构成341的3层神经网络结构.隐层传递函数为tansig,输出层传递函数为purelin,训练函数为trainlm,学习函数为learngd,训练次数为5 000次,训练目标为0.001,学习速率为0.1.
2.2 BP神经网络预测结果
BP神经网络预测结果见表2.
2.3 马尔科夫修正
2.3.1 状态划分
为分析马尔科夫预测模型对预测精度的影响,将第19~26组样本数据预测值的相对残差值归一化至[0,1.00](见表2的第5列),求出其平均值为0.44.根据黄金分割法(取s=1),可将归一后的相对残差值划分为3个状态(见表2的第6列).对于状态E1,0.618×0.44=0.271 92≈0.27,即E1∈[0,0.27);对于状态E2,0.27+0.618=0.888≈0.89,即E2∈[0.27,0.89];状态E3∈(0.89,1.00].根据式(1)将归一化后的相对残差所对应的3个状态反归一化到相对残差序列,即相对残差可以划分为[-11.0%,-4.6%)、[-4.6%,10.0%]以及(10.0%,12.6%]等3个状态分别表示所预测的船舶交通量偏大、适中和偏小.
2.3.2 求状态转移概率矩阵
由表2的第6列可知,第19~26组样本的状态依次为E2,E1,E2,E2,E2,E1,E3,E1.根据马尔科夫过程,从状态Ei经1步转移到Ej的频数见表3.
第27组样本处于状态E2和E3的概率一样大.根据公式
X=X^/(1-Q)对预测值进行马尔科夫修正,式中:X^为BP神经网络预测值,Q为对应的相对残差区间.由表3可知,第27组样本的预测值为532,经马尔科夫模型修正后的预测值区间分别为(480,509)(状态E2)和(509,592)(状态E3),则经修正后的预测值取两区间平均值的平均值后为523.
第28组样本处于状态E1的概率最大.由表2可知,第28组样本的预测值为584,经马尔科夫模型修正后的预测值区间为(527,559),取平均值后为543.
同理可得第29~33组样本的预测区间分别为(470,546),(616,654),(571,664),(629,668),(522,606),取各区间的平均值后分别为508,635,618,649,564.经马尔科夫模型修正后的BP神经网络预测值见表4.
由表4可知,BP神经网络预测的月度船舶交通量残差区间为[-12.9%,12.3%],经马尔科夫模型修正后,BP神经网络预测的月度船舶交通量残差为[-9.9%,5.4%].经马尔科夫模型修正后的BP神经网络预测模型的预测精度优于单一的BP神经网络预测模型.
3 结束语
船舶交通量的预测精度对确保导航安全、资源的有效利用以及减少水上交通事故的发生具有重要意义.本文提出采用BP神经网络马尔科夫预测模型提高船舶交通量的预测精度.实例验证结果表明,经马尔科夫模型修正后的BP神经网络预测的月度船舶交通量残差区间从[-12.9%,12.3%]降低至[-9.9%,5.4%],说明经马尔科夫模型修正后的BP神经网络预测模型的预测精度优于单一的BP神经网络预测模型的预测精度.BP神经网络马尔科夫模型适用于中长期船舶交通量预测.
参考文献:
[1]刘敬贤, 张涛, 刘文. 船舶交通流组合预测方法研究[J]. 中国航海, 2009, 32(3): 8084. DOI: 10.3969/j.issn.10004653.2009.03.018.
[2]张树奎, 肖英杰. 船舶交通流量预测的灰色神经网络模型[J]. 上海海事大学学报, 2015, 36(1): 4649. DOI: 10.13340/j.jsmu.2015.01.008.
[3]馬晓波, 刘雪菲, 戴冉. 优化的长山水道船舶交通流量灰色系统预测模型[J]. 上海海事大学学报, 2016, 37(2): 1216. DOI: 10.13340/j.jsmu.2016.02.003.
[4]郝勇, 王怡. 基于优化RBF网络的港口船舶交通流量预测[J]. 中国航海, 2014, 37(2): 8184. DOI: 10.3969/j.issn.10004653.2014.02.019.
[5]翟久刚, 田延飞, 严新平. 基于BP神经网络与残差分析的船舶交通流量预测[J]. 上海海事大学学报, 2013, 34(1): 1922. DOI: 10.3969/j.issn.16729498.2013.01.005.
[6]FENG Hongxiang, KONG Fancun, XIAO Yingjie. Vessel traffic flow forecasting model study based on support vector machine[C]∥Advanced Research on Electronic Commerce, Web Application, and Communication. Berlin Heidelberg: Springer, 2011: 446451. DOI: 10.1007/9783642203671_72.
[7]LI Mingwei, HAN Duanfeng, WANG Wenlong. Vessel traffic flow forecasting by RSVR with chaotic cloud simulated annealing genetic algorithm and KPCA[J]. Neurocomputing, 2015, 157: 243255. DOI: 10.1016/j.neucom.2015.01.010.
[8]冯宏祥, 肖英杰, 孔凡邨. 基于支持向量机的船舶交通流量预测模型[J]. 中国航海, 2011, 34(4): 6266. DOI: 10.3969/j.issn.10004653.2011.04.014.
[9]李俊, 徐志京, 唐贝贝. 基于GA优化的灰色神经网络船舶交通流量预测方法研究[J]. 船海工程, 2013, 42(5): 135137. DOI: 10.3963/j.issn.16717953.2013.05.036.
[10]QI Yan, ISHANK Sherif. A hidden Markov model for short term prediction of traffic conditions on freeways[J]. Transportation Research Part C, 2014, 43: 95111. DOI: 10.1016/j.trc.2014.02.007.
[11]刘宗明, 贾志绚, 李兴莉. 基于灰色马尔科夫链模型的交通量预测[J]. 华东交通大学学报, 2012, 29(1): 3034. DOI: 10.3969/j.issn.10050523.2012.01.007.
[12]孔垂猛, 韓印. 基于灰色马尔科夫模型的波动性交通流量预测[J]. 森林工程, 2015(1): 9296. DOI: 10.16270/j.cnki.slgc.2015.01.022.
[13]景亚平, 张鑫, 罗艳. 基于灰色神经网络与马尔科夫链的城市需水量组合预测[J]. 西北农林科技大学学报(自然科学版), 2011, 39(7): 229234. DOI: 10.13207/j.cnki.jnwafu.2011.07.016.
[14]何鑫, 宋平岗, 官二勇. 用马氏链方法预测全国年发电量趋势[J]. 华东交通大学学报, 2006, 23(4): 5154. DOI: 10.3969/j.issn.10050523.2006.04.015.
[15]WANG Yifan, CHENG SHihmin, HSU Meihua. Incorporating the Markov chain concept into fuzzy stochastic prediction of stock indexes[J]. Applied Soft Computing, 2010, 10(2): 613617. DOI: 10.1016/j.asoc.2009.08.028.
[16]高大启. 有教师的线性基本函数前向三层神经网络结构研究[J]. 计算机学报, 1998, 21(1): 8086. DOI: 10.3321/j.issn:02544164.1998.01.011.
[17]FRANK T D. Numeric and exact solutions of the nonlinear ChapmanKolmogorov equation: a case study for a nonlinear semigroup Markov model [J]. International Journal of Modern Physics B, 2009, 23(19): 36293643. DOI: 10.1142/S0217979209053497.
(编辑 贾裙平)