基于LM—BP神经网络的地震直接经济损失快速评估方法研究

赵士达 张楠 张斯文 孙晓东
摘要:
在综合考虑地震致灾因子、抗震设防因子、经济指标因子的基础上,选取地震震级、震源深度、受灾面积、受灾人口、设计基本地震加速度、人均GDP和产业机构比例等7个因素作为主要评价指标,运用神经网络分析方法,建立了基于LM-BP神经网络的地震直接经济损失评估模型。从历史地震事件中提取相关数据作为样本,并使用该样本对网络进行训练。最后对模型输出结果的误差率和模型的泛化能力进行分析,认为该模型可以有效评估地震直接经济损失,并具有较高的稳定性。
关键词:地震灾害;灾害评估;直接经济损失;LM-BP神经网络
中图分类号:P315-39文献标识码:A文章编号:1000-0666(2016)03-0500-07
0引言
随着我国经济的快速增长、城市规模的不断扩大,地震灾害对社会造成的影响也在不断加大,防震减灾工作显得尤为重要(赵士达等,2014a)。作为防震减灾工作一部分的震后应急救援和抗震救灾可以有效地减少地震造成的经济损失和人员伤亡(赵士达等,2014b;王东明等,2015),快速、准确地对地震灾区人员伤亡和经济损失做出评估是震后应急救援和抗震救灾工作能否收到实效的前提条件(刘如山等,2014)。
近年来,诸多学者使用不同的方法对震后经济损失快速评估进行了深入的研究,这些评估方法可分为5大类:分类清单法(陈洪富等,2013)、经济法(陈棋福等,1997)、遥感法(陈鑫连,谢广林,1996)、信息法(刘洋等,2009;刘佳友,徐琳瑜,2007)和神经网络法(范传鑫,2014)。其中分类清单法的应用最为广泛,该方法通过地震烈度衰减关系计算出地震影响场烈度空间分布,再综合分析各个烈度等级建筑物的类型、数量、空间分布以及建筑物的易损特性等,计算出各类建筑物的损失情况。但使用该方法进行地震灾害快速评估时对灾区的基础数据库要求比较高,基础数据库数据不完整、数据更新过慢、数据细化程度不够等都会使评估结果出现严重的偏差。随着神经网络技术的不断成熟,其在模式识别、函数逼近等方面得到了广泛的应用,一些学者也将这一技术应用到地震灾害损失评估中。
BP(Back Propagation,反向误差传播算法)神经网络算法是应用最广泛的一种神经网络算法,具有较强的非线性映射能力、自适应能力、容错能力和泛化能力(孙艳萍等,2010),但也存在收敛速度慢和容易陷入局部极小值等问题。为了克服这些问题,本文提出一种改进型LM-BP神经网络,并基于此建立了地震直接经济损失评估模型。
1影响地震直接经济损失的因素
11地震直接经济损失的界定
从灾害学的角度分析,灾害损失评估是对灾害造成的人员伤亡、直接经济损失和间接经济损失的评估,因此地震灾害损失可划分为人员伤亡、经济损失和救灾投入3部分,其中经济损失包括直接经济损失和间接经济损失。地震直接经济损失又包括地震灾害和地震次生灾害造成的建筑物、工程设施、设备、物品破坏导致的经济损失(王伟哲,2012)。
12地震灾害影响因子的分类研究
121地震致灾因子
震级是表征地震强弱的量度,是划分震源释放能量大小的等级。震级越大,地震释放的能量就越大,破坏能力就越强,相同条件下造成的直接经济损失也就越大。通常讲震级每相差10级,能量相差30倍,由此可见,震级是地震造成经济损失的重要因素之一。震源深度对地震破坏程度的影响也很大,相同震级的地震,震源深度越浅,造成的破坏就越严重。有统计表明,相同震级的地震震源深度从10 km减小到5 km,或是从20 km减小到10 km时,震中区域烈度平均会提高1度,故震源深度也是地震造成经济损失的重要因素之一。地震烈度是指地震发生时,在波及范围内一定地点地面振动的激烈程度(或解释为地震影响和破坏的程度)。一般来讲,距离震源越近,破坏就越大,烈度也就越高。在一次地震的受灾区域内会存在多个烈度区,而且这些烈度区的面积和分布并不规则。地震灾区的烈度评定在现场工作人员完成灾情调查后才能给出,在时间上不能满足地震经济损失快速评估的要求,且如果逐一计算各个烈度区的损失情况也会大幅度地增加计算的复杂程度。所以本文以总受灾面积为灾害承载体,选取地震震级和震源深度为主要致灾因素,对灾区进行经济损失评估。灾区面积的大小与地震直接经济损失成正相关关系,其他条件相同的情况下,灾区面积越大,经济损失也就越大。
122抗震设防因子
一个地区在遭受地震破壞时,其自身的抗震设防能力会对其产生重要的保护作用,抗震设防能力越强其抗御地震破坏的能力也就越强。抗震设防烈度是各类建筑物建设时采用设防标准的重要依据。各地区的建筑物都要按照该地区的抗震设防烈度要求进行建设。虽然地区建筑物实际设防烈度和地区的抗震设防烈度会存在一定的差距,但整体上抗震设防烈度可以反映出一个地区的抗震设防能力。
在以烈度为基础作为抗震设防标准时,由烈度给出相应的峰值加速度,烈度与设计加速度并不是一一对应的,在同一个设防烈度下,可能会对应不同的加速度值。这主要是由于同一烈度下,不同的场地类型地震加速度也有所不同。所以本文在评估一个地区的抗震设防能力时,主要考虑该地区的设计基本地震加速度。
123社会经济指标因子
一般来讲,在遭受同等地震的情况下,地区经济越发达,经济损失就越严重。这主要是因为经济越发达,地区人口越集中、生命线工程集中和地上地下管网越密集。人均GDP是衡量一个地区经济发展水平最重要的指标之一,人均GDP越高,该地区的经济基础和经济发展状况就越好,同等地震破坏的情况下,损失也就越大。不同的产业结构受地震破坏影响程度也不同。第一产业和第二产业所占的比重越大,受到地震破坏时相比第三产业经济损失也就越大。
除了以上两个重要因素外,受灾人数也与地震直接经济损失成正相关关系,其他条件相同的情况下,受灾人数越多,所涉及的社会财富越大,经济损失也就越大。
124其它因素
地震间接引起的火灾、水灾、毒气泄漏、疫病蔓延、海啸等,称为地震的次生灾害。次生灾害造成的经济损失是地震直接经济损失的一部分,严重的次生灾害造成的经济损失甚至比各类建筑物损毁造成的损失还要大。
地震后,地区的应急处置和抢险救灾能力与诸多因素有关,如交通条件、生命线工程抢修速度、有无应急预案等,这些因素决定了该地区降低地震灾害经济损失和人员伤亡的能力以及地区的应急处置和抢险救灾能力。
13地震灾害影响因子的提取
地震灾害样本信息选取的原则是容易获取的,对于一些记录不全面或者信息准确性存在问题的样本应舍弃。本文地震灾害信息的样本主要选自《2001~2005中国大陆地震灾害损失评估报告汇编》(中国地震局震灾应急救援司,2010)中记录完整的历史地震,其中震级、震源深度、灾区面积、受灾人口和地震直接经济损失可在灾害评估报告中查到。各地区的设计基本地震加速度通过查阅《建筑抗震设计规范》(GB 50011—2001)来获取。人均GDP和产业结构比例是通过查阅各地区统计公报或地区年鉴获取的。在《中国大陆地震灾害损失评估报告汇编》(中国地震局震灾应急救援司,2010)中记录的地震次生灾害造成的经济损失不多,一般都在总直接经济损失的5%以内,所以笔者不直接考虑次生灾害的影响,而是得出总的直接经济损失评估后,按照次生灾害的严重程度,对总的直接经济损失进行修正。由于笔者无法获取足够的资料对各个地区的防灾减灾能力做出评价,所以没有将地区防灾减能力作为影响因子。
一次地震经常会对多个地区产生影响,而各个地区的经济水平和产业结构也各不相同,所以需要对受灾区域的GDP和产业结构重新评估,估算公式分别为
G=∑ni=0GiSiS, (1)
R=∑ni=0RiSiS.(2)
式中,G为灾区人均GDP;n为地震造成的受灾区域数量;Gi为第i个地区的人均GDP;S为灾区总面积;Ri为第i个地区第一、二产业占GDP的比例。
2LM-BP神经网络
21BP神经网络的优缺点
在BP神经网络中,输入层的神经元用于接收外界信息并将信息传给隐含层(郭章林等,2004)。隐含层神经元主要负责对接收的信息进行变换,并将信息传给输出层。隐含层的层数不是固定的,而是根据信息变化复杂程度的需要而定的。输出层主要负责将信息向外界输出(田鑫,朱冉冉,2012)。BP神经网络结构如图1所示。
假设某个神经元的输入信号x=(x1,x2,…,xn)T,可调节的连续权值w=(w1,w2,…,wn)T,θ为神经元的兴奋阈值,u(*)为基函数,该神经元的输出则为u(x,w,θ)。输出信号u需要经过激活函数的挤压,即y=f(u),将输出值的范围压缩到非常小的范围内。
虽然BP神经网络具有以上优点,但自身也存在着局限性。BP神经网络采用的是梯度下降算法,而梯度下降算法在其误差曲面中会出现平坦区域和多个极小值点。在平坦的误差曲面中,误差下降速度慢,网络的训练速度也会变慢。当遇到局部极小值时,网络会误认为是最优解,导致仿真失败。
22LM-BP网络
Levenberg-Marquardt算法(简称LM算法),是一种非线性最小二乘算法,是用模型函数对待估参数向量在其领域内做线性近似,忽略掉二阶以上的导数项,从而转化为线性最小二乘问题,所以该算法的收敛速度比梯度算法要快很多。LM算法虽然在收敛速度上有明显的提升,但仍然可能陷入局部极小值,导致仿真失败。因此,在进行仿真时需要对迭代次数进行限定,防止陷入局部极值。当迭代次数超过限定就自动跳出,重新给网络赋予权值和阈值,然后重新迭代,直到得出预期的结果。
23网络的构建与训练
笔者在计算时主要考虑震级、震源深度、受灾面积、受灾人口、设计基本地震加速度、地区人均GDP和产业结构比例7个因素,所以设计的网络输入层为7个节点,输出层为1个节点。隐含层的节点数量需要在仿真中进行逐一尝试才能确定下来。隐含层节点数量经验参考公式为
h=p+q+a.(3)
其中,p为输入层节点数量,q为输出层节点数量,a为0~10的自然数。神经网络的训练能力和泛化能力在一定程度是存在矛盾的。训练初期,随着网络训练能力的提高,泛化能力也在提高。当训练能力提高到一定程度后,随着网络训练能力的提高,泛化能力就会下降。出现这一问题的原因是网络训练的样本过多,訓练精度过于高,产生了过拟合现象,当遇到非训练集中的样本时,网络输出精度就会大幅度下降。为了避免过拟合现象的出现,笔者在网络训练时将样本分为训练样本、测试样本和确认样本3部分。训练样本用于调整网络连接的权值和阈值,提高训练精度。测试样本用来评价训练后的网络,如果训练后的网络满足测试样本的要求就结束训练。确认样本用于防止过拟合训练,当确认样本的精度随着网络精度提升而下降时,就强行结束训练。笔者选取的样本是按照地震发生时间顺序排列的,不能直接进行样本分组和训练,需要先将样本的顺序随机打乱后,再进行样本分组和训练。图2为整个网络训练设计流程图。
3LM-BP神经网络的实例应用
31数据归一化处理
本文选取了《2001~2005年中国大陆地震灾害损失评估报告汇编》(中国地震局震灾应急救援司,2010)中记录的30次地震作为样本,样本数据如表1所示。其中训练样本占总样本的80%,测试样本和验证样本各占10%。由于样本中的数据单位不统一且数值取值范围很大,所以需要对样本中的数据进行无量纲处理,并将数据取值范围压缩到一个很小的区域内。本文所选取的样本数据均为正数,可选取logsig函数作为激活函数,将样本数据挤压到(0,1)之间。但logsig函数曲线在数轴0和1两点附近曲线平缓,影响网络训练的速度和网络的灵敏性。因此,在进行数据归一化处理时,需要将样本集的数据按类型归一化到(01,09)区域内。
32LM-BP神经网络的构建
本文所设计的LM-BP网络输入层、隐含层和输出层均为1层,其中输入层有7个节点,隐含层节点数目范围是3~13,输出层有1个节点。使用Matlab2010对LM-BP神经网络进行训练和仿真,逐一尝试隐含层节点数目,最终确定隐含层节点数为8时,网络拟合的效果最佳。LM-BP网络结构示意图如图3所示。
33LM-BP神经网络的训练与仿真分析
图4为LM-BP神经网络训练样本、测试样本和确认样本的误差曲线图。从图中可以看出,在训练初期3种样本的误差曲线都随着训练的进程而显著下降,这表明该网络具有十分良好的泛化能力。笔者在设计中设定确认样本误差曲线连续5步上升就结束仿真,防止网络进入过拟合状态。从图中可以看出,在训练进行到第13步时,确认样本误差曲线开始上升,并且一直保持上升到第18步。这主要是由于网络产生了过拟合所导致的。在第13~18步中,训练样本误差曲线保持下降,而测试样本误差曲线却一直上升,也印证了网络开始进入过拟合状态。
图5为30个样本的训练和预测情况示意图,其中横轴第1~24个数据为训练样本,第25~27个数据为确认样本,第28~30个数据为预测样本。从图中可以看出训练样本和确认样本的拟合度非常高,测试样本的预测值与真实值也十分接近,其预测相对误差如表3所示。
34LM-BP神经网络在地震直快速评估中的应用
以2012年6月24日宁蒗—盐源57级地震为例,使用LM-BP神经网络进行地震直接经济损失评估。该次地震的震源深度为11 km,受灾人口1162万人,受灾面积2 218 km2。宁蒗彝族自治县和盐源县两地地震设防加速度同为015g,所以设防加速度取015g。2011年宁蒗彝族自治县和盐源县人均GDP分别为7 445元和18 045元,产业结构比分别为598%和795%,同时两个县的受灾面积分别为1 365 km2和853 km2。根据式(1)和(2)可得平均GDP为11 522元,产业结构比为6738%。
将上述7个因素作为输入条件,使用训练好的网络进行仿真,得出直接经济损失为653亿元,本次地震的实际直接经济损失为772亿元。仿真结果和实际结果存在1541%的相对误差,可以满足经济损失快速评估的要求。进一步分析仿真结果可以发现,该次仿真的相对误差比网络训练时的相对误差要大,且仿真结果比实际值要小。这主要是因为训练网络时采用的样本选取的是2000~2005年地震事件,当时我国各地区GDP很低。而笔者选取的是2012年的宁蒗—盐源地震,2012年我国GDP已经比2000时大幅度提高。当输入2012年GDP时,网络会认为该输入为奇异值,会对该数据进行压缩,导致仿真结果比实际结果小,且相对误差增大。这一问题可以待地震灾害损失评估报告更新后,加入近年来的地震事件样本继续训练来解决。
4结论
本文主要分析影响地震直接经济损失的主要因素,并选取地震震级、震源深度、受灾面积、受灾人口、设防加速度、人均GDP和产业结构比例作为主要影响因素。通过分析BP神经网络的优缺点,提出改进型LM-BP神经网络作为地震直接经济损失评估模型。使用历史地震样本对该网络进行训练,最终得到同时具备较强泛化能力和拟合能力的预测模型。同时该模型也存在一定的局限性,例如训练样本震级都小于7级,对于7级以上地震直接经济损失评估会产生较大的偏差。造成这一问题的主要原因是目前可以查阅到的记录全面的地震灾害评估报告较少,地震事件样本不充足。待2005年以后的地震灾害评估数据更新后,使用更加充足的样本再重新训练,可以有效地解决这一问题。
参考文献:
陈洪富,孙波涛,陈相兆等. 2013. 基于云计算的中国地震灾害损失评估系统研究[J].地震工程与工程振动, 33(1):198-203.
陈棋福,陈颙,陈凌. 1997. 利用国内生产总值和人口数据进行地震灾害损失预测评估[J].地震学报,19(6):640-649.
陈鑫连,谢广林. 1996. 航空遥感的震害快速评估与救灾决策[J].自然灾害学报,34(5):29-34.
范传鑫. 2014. 基于改进型的RBF神经网络的城市震害损失评估模型[D]. 黑龙江:哈尔滨工业大学,17-34.
郭章林,刘明广,解德才.2004. 震灾经济损失评估的遗传神经网络模型[J]. 自然灾害学报,13(6): 92-96.
刘佳友,徐琳瑜. 2007. 一种区域环境风险评价方法——信息扩散法[J]. 环境科学学报,27(9):1549-1556
刘如山,余世舟,颜冬启等. 2014. 地震破坏与经济损失快速评估精细化方法研究[J].应用基础与工程科学学报, 22(5):928-940.
刘洋,唐川,冯毅. 2009. 基于AHP信息量法的地质灾害危险性评价[J].地球与环境,41(2):173-178
孙艳萍,窦玉丹,张明媛等.2010. 基于神经网络的震害损失评估模型[J].防灾减灾工程学报,30(9):168-171.
田鑫,朱冉冉. 2012. 基于主要成分分析及BP神经网络分析的地震人员伤亡预测模型研究[J]. 西北地震学报,34(4):365-368.
王东明,朱达邈,李永佳. 2015.中国地震灾害损失调查评估培训系统在线考试子系统的设计与实现[J].地震研究,38(3):508-516.
王伟哲.2012.地震直接经济损失评估:BP神经网路及其应用[D]. 成都:西南财经大学,12-15.
赵士达,张楠,杨爽 . 2014a. 基于云计算和Android的地震應急信息获取系统[J]. 计算机应用, 34(S1): 298-300.
赵士达,张楠,杨爽. 2014b. 基于Android系统的避难场所查询软件开发[J]. 电子技术应用,40(3): 133-136.
中国地震局震灾应急救援司. 2010. 2001~2005年中国大陆地震灾害损失评估报告汇编[M]. 北京:地震出版社.
GB 50011—2001,建筑抗震设计规范[S]. 技术文