基于贝叶斯网络的内河船舶碰撞人的失误分析

陈亚东 +张延猛 +胡昊
DOI:10.13340/j.jsmu.2017.03.008
文章编号:1672-9498(2017)03004106
摘要:
为分析对船舶航行安全有显著影响的人的因素,引入Swain & Guttmann模型和贝叶斯网络分析内河船舶碰撞事故。依据Swain & Guttmann模型的信息处理过程(感知、决策和行动)梳理内河船舶碰撞形成机理。利用领域专家知识和小样本量数据学习法构建贝叶斯网络,计算网络节点间的条件概率。利用贝叶斯网络的不确定性知识推理方法,得出影响船舶航行安全的关键人的因素。该结果与真实事故案例统计结果相吻合,这说明Swain & Guttmann模型和贝叶斯网络适用于对内河船舶航行安全的综合分析。
关键词:
航运安全; 内河船舶碰撞; 貝叶斯网络; 最大期望算法; 安全风险; 人的失误
中图分类号: U698.6
文献标志码: A
Human error analysis of inland ship collision based on Bayesian network
CHEN Yadonga, ZHANG Yanmengb, HU Haoa
(a. School of Naval Architecture, Ocean & Civil Engineering; b. Chinese Underwater Technology Institute,
Shanghai Jiaotong University, Shanghai 200240, China)
Abstract:
In order to analyze human factors that have a significant impact on the ship navigation safety, the Swain & Guttmann model and Bayesian network are proposed to analyze inland ship collision accidents. The collision mechanism is summarized according to the information processing procedure (perception, decision making and action) of the Swain & Guttmann model. The Bayesian network is established with the combination of the domain expert knowledge and the learning method with small amount of sample data, and the conditional probabilities between the network nodes are computed. The main human factors, obtained using the uncertain knowledge inference method of the Bayesian network, are consistent with the statistical results from real accident cases, which reveals that the Swain & Guttmann model and Bayesian network are applicable for comprehensive analysis of inland ship navigation safety.
Key words:
navigation safety; inland ship collision; Bayesian network; expectation maximization algorithm; safety risk; human error
0引言
随着内河水路运输需求持续高涨,水路通航密度增大,通航环境日益复杂,碰撞事故成为最频发的内河船舶安全事故。学者们[13]通过研究认为,80%的船舶安全事故与人的因素有关,且随着航行设备与航行技术的发展,人的因素在航行安全中的作用愈加显著。
船舶碰撞事故中人的失误存在不确定性,各种失误间存在因果关联关系。近几年,数据挖掘技术在船舶航行安全领域人的可靠性分析中得到了应用。贝叶斯网络结合数据挖掘和不确定性知识推理,是目前在多领域均得到广泛应用的一种人工智能技术。[4]1986年,PEARL首次在专家系统中引进了贝叶斯网络。贝叶斯网络是直观表达变量间概率依赖关系的一种图形模型,由网络结构和条件概率分布两部分组成[5],以有向无环图表示研究对象随机变量间的结构属性,节点对应于模型中的随机变量,节点间的有向边代表变量的条件依赖关系,并产生节点间的条件概率值。贝叶斯网络能够形象表达随机变量间的因果关联关系,并进行不确定性知识推理。[6]REN等[1]针对海上航行安全事故中的人和组织因素,通过专家判断法在评价框架基础上建立了贝叶斯网络因果分析模型。HNNINEN等[7]以芬兰湾船舶碰撞为研究对象,通过贝叶斯网络模型研究人的因素对船舶碰撞概率的影响,通过观察网络中人的因素节点状态的变化来检测因果概率的变化情况,并通过敏感性分析得出在两船会遇情况下不合理的避让操作是引发船舶碰撞最重要的原因。
本文以内河船舶碰撞事故为研究对象,在地方海事局网站共搜集100余起事故调查报告作为构建贝叶斯网络的分析样本,最终取出123份,并通过Swain & Guttmann模型分析和梳理碰撞事故的形成机理,完整反映事故的发生过程。在Swain & Guttmann模型的平台上,利用贝叶斯网络在处理不确定问题方面的优势,通过期望最大(Expectation Maximization, EM)算法在小样本量下构建内河船舶碰撞贝叶斯网络分析模型,并结合贝叶斯网络的诊断推理和因果推理,定量分析人的因素间的因果依赖关系。
1船舶碰撞人的失误模型
Swain & Guttmann模型(见图1)以信息处理理论为基础[8],将信息处理过程简化为3个阶段:感知、认知、反应/行动。人的行为在这3个阶段可能受到环境、个人心理和生理等方面的影响,该模型将这些可能导致人的失误发生的因素定义为行为成形因子,并将行为成形因子分成外部、应激物和内部3大类。
根据Swain & Guttmann模型,在构建内河船舶碰撞人的失误模型(见图2)前,考虑:(1)内河船舶碰撞存在航行环境特殊性。内河船舶碰撞是船舶在受限水域发生的交通事故的一种形式,人的失误是船舶在受限水域发生碰撞事故的一种致因。(2)着重研究内河船舶避碰过程中人的失误的表现形式及其内在关联。人的失误的行为成形因子包括船上的工作条件、航行的水域和气象条件等。尽管在每个阶段,这些行为成形因子均会对人的行为造成影响,但这些因子很难从事故报告中收集并进行量化。因此,本文仅从人的失误的具体表现入手,并尽量选取通航环境类似的内河船舶碰撞事故,而不考虑环境因素等其他行为成形因子。(3)船舶碰撞事故不是由某单独或单船的人的失误造成的,往往是由一船的失误导致另一船的失误而形成的一连串失误导致的结果。这些失误间的内在关系可由事故链或网络结构表示。(4)整个船舶碰撞过程大致分为3个阶段:感知、决策和行动。人的失误可能发生在上述每个阶段。3个阶段间存在因果关系,前一阶段人的失误可能导致后一阶段人的失误,这一系列人的失误最终可能导致船舶碰撞。
2贝叶斯网络节点选取
各国海事机构对各年度海上船舶碰撞事故均有统计分析。[9]多位学者[1012]对船舶碰撞过程中人的失误也进行了相关的研究。结合各国海事机构对碰撞事故中涉及的人的因素的統计,参照学者对人的失误与碰撞结果的关联性分析结果,按照“感知、决策、行动”3个阶段,将123起事故中涉及的人的失误进行阶段性归类。在征询行业专家意见的基础上,选取12种人的失误作为主要的研究对象,见图3。尽管在船舶碰撞过程中出现的人的失误远不止这12种,但为构建的网络模型的实用性,忽略一些根据经验得出的对碰撞结果影响较小的人的失误(如水路调查不充分),并将一些相近的人的失误归到同一类中(如“沟通不当”归到与来船之间缺少交流或交流信息不确切一类,“碰撞危险判断失误”归到对碰撞危险估计不足、未判断出存在碰撞危险一类)。在确定内河船舶碰撞过程中每阶段可能发生的人的失误后,根据Swain & Guttmann模型可确定在船舶碰撞过程中人的失误间的阶段性因果关系,如图3所示。
Swain & Guttmann模型在信息处理理论基础上再现了船舶碰撞过程。贝叶斯网络作为该模型的补充,凭借强大的案例数据学习和不确定性知识推理能力,可以通过确定事故发生过程的网络拓扑结构和节点间的条件概率表,推理出节点间的因果概率关系。
3贝叶斯网络构建
3.1贝叶斯网络结构确定
鉴于客观上事故调查报告数量不充足和主观上关于船舶碰撞的研究积累和领域知识储备较为完备,本文通过专家组的领域知识进行贝叶斯网络拓扑结构的搭建。共邀请3位领域内专家组成专家组:专家A来自上海航务管理处,有多年内河船舶航行安全管理及事故处理经验;专家B来自上海某航运物流公司,有多年的散货运输实务经历及安全管理经验;专家C来自上海某高校,研究方向之一为船舶航行安全。
节点(即人的失误类别)的位置、节点之间的联系均由3位专家结合自身经验和样本事故报告,根据可行性、简洁性原则在讨论中确定,最终构建的贝叶斯网络拓扑结构见图4。
3.2贝叶斯网络参数确定
3.2.1内河船舶碰撞事故样本
在实际的船舶碰撞过程中,事故的发生往往是由当事两船或多船人的失误共同造成的,往往是一船的失误导致了另一船的失误,而不是一船的上一个失误导致了该船下一个失误。[13]在分析船舶碰撞形成原因时,任何一方在这一过程中出现人的失误都将计入事故的诱因中。碰撞的主体都需要对船舶碰撞事故承担相应的责任。本文重点收集通航环境类似的内河发生的碰撞事故,并在整理收集到的船舶碰撞事故时用1,2分别表示每类人的失误是否发生(见表1):1表示在该起事故中该类人的失误没有发生;2表示在该起事故中该类人的失误确实发生,包括碰撞的主体间仅一船发生了该类失误或所有的涉事船舶均出现了该类失误。同样,在构建贝
3.2.2条件概率表计算
从123起船舶碰撞事故数据中取出103起用于条件概率计算,其余20起用于模型验证。因收集的样本量较小,故通过Bootstrap 再抽样方法有放回地模拟重取样,在小数据集中加入n个“新”样本,然后采用随机算法将扩大后的数据中任意样本的某些变量的取值去除,将小数据集转化为不完备数据集,进而采用GeNIe软件内嵌的EM算法进行参数学习,计算出各节点间的条件概率。EM算法是一种从数据不完全或数据有丢失的数据集中求解概率模型参数的最大似然估计方法。条件概率表中,缺失的部分样本数据和节点间的条件概率均未知,且存在相互推理关系,故先赋予某节点一初始条件概率值,在此基础上计算出缺失的样本数据的取值,再从样本数据的计算值出发,得出新的条件概率值,直至该参数收敛。
以节点“瞭望不当”的条件概率P(D2|A1,B1,C2)的计算过程为例进行说明(下标1和2分别表示该类人的失误没有发生和确实发生)。
E步:将初始条件概率值设置为0.5,即P(D2|A1,B1,C2)=0.5,然后依此计算缺失数据的条件期望值,再将该值视为观测值,得到完整的观测值并将其代入最大似然估计公式[14]
P(D2|A1,B1,C2)=N(D2,A1,B1,C2)N(A1,B1,C2)(1)
M步:将上述最大似然估计公式最大化,得出P(D2|A1,B1,C2)的最大可能值。
重复上述两个步骤直到参数收敛,即可得到P(D2|A1,B1,C2)的最佳估计值。
4.1.1敏感性分析
根据以下两条定律,以节点“碰撞危险判断失误”为例,对该贝叶斯网络进行敏感性分析。
定律1任一父节点先验概率的细微增加或减少将相应地引起其子节点后验概率的增加或减少。
定律2所有父节点先验概率的变化对其子节点后验概率的影响程度应大于其中任一父节点先验概率对其子节点后验概率的影响[15]。
计算可得,P(I2|D1,F1,G1)=0.05,P(I2|D1,F1,G2)=0.38,P(I2|D1,F2,G2)=0.83,P(I2|D2,F2,G2)=1,
即:当父节点“瞭望不当”“沟通不当”“未充分考虑航行气象”等人的失误均未发生时,子节点“碰撞危险判断失误”的发生概率为0.05;当父节点“未充分考虑航行气象”确实发生(即发生概率为1)时,“碰撞危险判断失误”发生的后验概率由0.05增大至0.38;当再增加“沟通不当”这一人的失误时,发生“碰撞危险判断失误”的概率会提升至0.83;在此情况下,如父节点中“瞭望不当”的发生概率也变为1,则子节点“碰撞危险判断失误”发生的后验概率达到1。子节点“碰撞危险判断失误”发生的后验概率随着父节点证据的逐渐增多而相应持续增大,这一增长过程与定律1和2相吻合,部分验证了模型的可靠性,增加了模型分析结果的可信度。
4.1.2有效性分析
利用20起碰撞事故进行案例分析以验证模型的有效性。将
每起事故中人的失误提取出来,作为证据节点输入网络中,计算出在每起事故对应的人的失误的组合下船舶碰撞发生的后验概率,得到:有8起事故发生的后验概率大于或等于0.95,占检验样本总量的40%,表明有相当比例的检验样本经过模型推理预测后得到的结论与实际情况相吻合;有7起事故发生的后验概率在0.90与0.95之间;有3起事故发生的后驗概率介于0.80与0.90之间;有2起事故发生的后验概率低于0.80。根据真实案例的贝叶斯网络推理结果,可以看出本文建立的贝叶斯网络中包含的事故形成机理、选取的人的失误种类以及网络拓扑结构和参数与船舶碰撞发生时的真实场景相符,能体现人的失误与最终的船舶碰撞事故的关联强度,表明构建的贝叶斯网络有效。因此,该网络可用于下一步的诊断与因果推理等,寻找关键的人的失误以进行有针对性的改进。
4.2诊断推理
诊断推理即基于构建的贝叶斯网络,在已知瞭望、对碰撞风险判断力、船舶避碰操纵等节点的状态时,对是否会引起船舶碰撞进行预测。
所有底层人的失误均未发生(即A1,B1,C1,E1和G1)对应的船舶碰撞发生的后验概率为0.21。现假设A2(发生“值班不当”的失误)对应的船舶碰撞发生的后验概率为0.59。当剩余的底层人的失误各自单独发生(即A2,B2,C2,E2和G2),且无其他人的失误及不利因素时,相应的船舶碰撞事故发生的后验概率分别为0.59,0.59,0.57,0.50和0.41。可以看出:相较于无人的失误及不利影响因素的状态,当底层人的失误发生时,船舶碰撞事故发生的后验概率会大幅提升;“值班不当”“疲劳驾驶”“雷达、ARPA设备使用不当”这3类人的失误对船舶碰撞有着最为强烈的影响,即船舶碰撞事故最有可能在这3类人的失误下发生。而且,这3类人的失误均为“瞭望不当”的父节点,这说明合理瞭望对船舶航行安全非常重要。
4.3因果推理
因果推理是在假设船舶碰撞事故已发生时,计算其他人的失误发生的后验概率。当船舶碰撞发生时,行动层的3类人的失误(J,K,L)的后验概率分别为P(J2|M2)=0.54,P(K2|M2)=0.58,P(L2|M2)=0.77。可以明显看出节点L(避让行动不当)的后验概率最高,即在船舶碰撞危险局面形成时,不合理的避让动作是导致船舶碰撞的最重要的因素。
当船舶碰撞已发生时,底层各类人的失误的后验概率分别为P(A2|M2)=0.32,P(B2|M2)=0.40,P(C2|M2)=0.24,P(E2|M2)=0.17,P(G2|M2)=0.14。很明显,B(疲劳驾驶)、A(值班不当)、C(雷达、ARPA设备使用不当)这3类人的失误对船舶碰撞发生的影响比底层其他人的失误的影响更大。这一分析结果得出的敏感人的失误也与真实船舶碰撞样本中高频出现的人的失误相吻合,再次说明该因果推理的有效性。
4.4最大可能致因链分析
对贝叶斯网络中致因链的分析更有助于从直观上了解船舶事故的形成机理。寻找导致船舶碰撞在人的失误层面上的最大可能致因链的过程为:(1)结果设置。假设船舶碰撞已发生(最大可能致因链分析实质仍为因果推理)。(2)贝叶斯因果推理。在碰撞事故发生的情况下,利用GeNIe软件计算每个节点代表的人的失误的后验概率。(3)逆向搜寻。从船舶碰撞节点开始,逆向向下寻找各子节点的后验概率最大的父节点。
可以看出,在船舶碰撞发生的前提下,其父节点中L(避让行动不当)的后验概率最高。取出节点“船舶避让行动不当”,依此方法得出最大可能致因链即为图5中粗线条所示链条:值班不当→瞭望不当→未及时发现来船→避让行动不当→船舶碰撞。最大可能致因链是船舶碰撞最有可能发生的路径,并未排除船舶碰撞事故按照其他致因链发生的可能性,也不影响其他影响因素的关键性。
5结束语
在Swain & Guttmann模型的平台上,构建出一般化的内河船舶碰撞人的失误链状模型,使动态复杂的船舶碰撞过程适于用贝叶斯网络表示,并引入期望最大(EM)算法,在小样本数据集的基础上,高效准确地将影响船舶航行的人的定性因素定量化,并应用贝叶斯网络不确定知识推理功能进行推理分析。
得出的主要结论为:(1)引发船舶碰撞的人的失误间存在因果关系,即船舶碰撞事故的形成过程是一个因果关系链条。(2)在引发船舶碰撞的底层人的失误中,最关键的因素为“值班不当”“疲劳驾驶”和“雷达、ARPA设备使用不当”,这3类人的失误均是“瞭望不当”的父节点,验证了合理瞭望对船舶航行安全的重要性。“避让行动不当”是最主要的直接触发船舶碰撞的人的失误。内河船舶碰撞最大可能致因链为:值班不当→瞭望不当→未及时发现来船→避让行动不当→船舶碰撞。(3)建立的模型在人的失误分析方面具有一定实用性。利用贝叶斯网络概率推理功能寻找出关键影响因素,推理结果与真实事故案例统计分析结果相吻合,证明了Swain & Guttmann模型和贝叶斯网络能够用于内河船舶航行安全事故的形成机理分析和人的因素对事故结果的关联强度分析。
参考文献:
[1]REN J, JENKINSON I, WANG J, et al. A methodology to model causal relationships on offshore safety assessment focusing on human and organizational factors[J]. Journal of Safety Research, 2008, 39(1): 87100. DOI: 10.1016/j.jsr.2007.09.009.
[2]AKYUZ E, CELIK M. A methodological extension to human reliability analysis for cargo tank cleaning operation on board chemical tanker ships[J]. Safety Science, 2015, 75: 146155. DOI: 10.1016/j.ssci.2015.02.008.
[3]HETHERINGTON C, FLIN R, MEARNS K. Safety in shipping: the human element[J]. Journal of Safety Research, 2006, 37(4): 401411. DOI: 10.1016/j.jsr.2006.04.007.
[4]ABIMBOLA M, KHAN F, KHAKZAD N, et al. Safety and risk analysis of managed pressure drilling operation using Bayesian network[J]. Safety Science, 2015, 76: 133144. DOI: 10.1016/j.ssci.2015.01.010.
[5]KHAKZAD N, KHAN F, AMYOTTE P. Safety analysis in process facilities: comparison of fault tree and Bayesian network approaches[J]. Reliability Engineering & System Safety, 2011, 96(8): 925932. DOI: 10.1016/j.ress.2011.03.012.
[6]KHAKZAD N, KHAN F, AMYOTTE P. Dynamic safety analysis of process systems by mapping bowtie into Bayesian network[J]. Process Safety & Environmental Protection, 2013, 91(1/2): 4653. DOI: 10.1016/j.pSept.2012.01.005.
[7]HNNINEN M, KUJALA P. Influences of variables on ship collision probability in a Bayesian belief network model[J]. Reliability Engineering & System Safety, 2012, 102: 2740. DOI: 10.1016/j.ress.2012.02.008.
[8]SWAIN A D, GUTTMAN H E. Handbook of human reliability analysis with emphasis on nuclear power plant applications[R]. US Department of Energy, 1983.
[9]刘正江, 吴兆麟, 严立. 船舶避碰过程中人的可靠性分析[J]. 大连海事大学学报, 2003, 29(3): 4347. DOI: 10.16411/j.cnki.issn10067736.2003.03.012.
[10]郑滨, 金永兴. 基于属性约简的海事人的失误致因分析[J]. 上海海事大学学报, 2010, 31(1): 9194.
[11]胡志武, 竹本孝弘, 古莊雅生. 船舶碰撞事故中人为错误的分类[J]. 航海技术, 2005(6): 1518.
[12]贾爱鹏, 王胜利. 基于STATISTICA的人的失误与船舶碰撞之间关系的研究[J]. 浙江国际海运职业技术学院学报, 2011, 7(4): 68.
[13]李红喜, 张连丰, 郑中义. 基于数据挖掘的船舶人为碰撞事故致因链研究[J]. 大连海事大学学报, 2014, 40(2):1012. DOI: 10.16411/j.cnki.issn10067736.2014.02.003.
[14]俞奎, 王浩, 吴信东, 等. 贝叶斯网络的并行EM学习算法[J]. 模式识别与人工智能, 2008, 21(5): 670676.
[15]JONES B, JENKINSON I, YANG Z, et al. The use of Bayesian network modelling for maintenance planning in a manufacturing industry[J]. Reliability Engineering & System Safety, 2010, 95(3): 267277. DOI: 10.1016/j.ress.2009.10.007.
(編辑赵勉)