基于AIS数据的船舶领域影响因素分析

周丹+郑中义






摘要:
为比较互见中开阔水域不同船舶领域影响因素的重要性,应用粗糙集理论的相关算法,对船舶领域影响因素之间的依赖关系进行分析,并进行影响因素约简和影响因素重要度计算.以渤海及黄海北部船舶自动识别系统(AutomaticIdentificationSystem,AIS)的数据为基础,应用MATLAB编程计算,得到船舶领域影响因素之间的依赖度、相对约简集和影响因素重要度.结果表明:船舶领域影响因素之间存在不同程度的冗余,其中风、浪或流可约简掉;会遇角度、航速、船舶大小、驾驶员级别、船舶密度、船舶类型和能见度的重要度分别为0.2791,0.2008,0.1794,0.2121,0.2359,0.1229和0.0935.该研究表明:在保证对船舶领域影响分辨性不变的前提下,驾驶员可选择较重要因素对船舶领域进行判断,并采取较恰当的避碰行动,保障航行安全;但在特殊的环境下,某些影响因素需要特别考虑.
关键词:
影响因素;粗糙集理论;属性约简;重要度
中图分类号:U676.1
文献标志码:A 收稿日期:20150818 修回日期:20151201
0引言
船舶领域的影响因素众多,已有对船舶领域的研究中通常只包括船舶领域影响因素中的某个因素或部分因素.例如FUJII(藤井)等[1]对通常航行条件下被追越船舶的领域尺度和狭窄水域的领域尺度进行了研究.GOODWIN[2]在研究船舶领域时得到了4个不同类型海域的船舶领域尺度和在不同船舶交通流密度下的船舶领域尺度.范贤华等[3]在研究水流条件下的船舶领域模型时考虑了船长、航速和潮流速度.PIETRZYKOWSKI等[45]对开阔水域会遇局面、船舶大小和狭窄水域参数等对船舶领域的影响进行了研究.HANSEN等[6]主要研究了水域类型和水域参数对船舶领域的影响.WANG[78]提出了四维船舶领域模型,该模型中涉及的影响船舶领域大小的因素包括船舶长度和速度.随后,WANG[9]给出了船舶领域模型的四维解析框架,它虽包含船舶领域的全部影响因素,但是如何利用模型确定全部影响因素在某数值下的船舶领域仍没有解决.利用基于神经网络[1011]的方法能得到船舶领域与其影响因素的关系,虽然这种方法能同时考虑较多的影响因素,但它是一种黑箱的方法.
确定船舶领域模型时很难同时考虑全部的影响因素.本文利用渤海及黄海北部船舶自动识别系统(AutomaticIdentificationSystem,AIS)的数据,应用粗糙集相关理论对船舶领域影响因素之间的关系、影响因素的重要度进行研究,并对影响因素进行约简.
1属性重要度计算与相对约简
1.1属性依赖度
1.2属性重要度
1.3P的Q约简
2船舶领域与其影响因素
2.1数据来源
目前,AIS数据已成为研究船舶领域的常用数据.本文采用2014年9月26日到2014年10月13日渤海及黄海北部水域的AIS数据.气象数据来自中央气象台的天气预报,水文数据来自国家海洋环境预报中心的预报.
2.2船舶领域
2.2.1船舶领域的选取
根据藤井和GOODWIN对船舶领域的定义,船舶领域是驾驶员为保证航行安全要保持的船舶间的安全距离,其与船舶之间的实际通过距离d直接相关.假设某船遇到一密度均匀的船舶交通流,并采取避碰措施通过.如图1所示,船舶领域由船舶之间的最小安全会遇距离决定,且在中心船O周围同一方向上,船O1的转向幅度必大于船O2和O3的,在船
O1与中心船O的距离为d时,船O1处船舶密度增大最多,即为船舶密度最大处(与藤井定义的领域边界相吻合).因此,以d作为船舶领域对船舶领域影响因素进行分析.
2.2.2船舶领域样本的获取
利用MATLAB编程计算船舶领域的流程见图2,其中:5000m与3000m参考文献[4];4.5nmile参考文献[13],绝大多数会遇船舶在相距4.5nmile时没有采取避碰行动;20s是通过计算得到的(假设航速为14kn,则船舶20s内航行的距离也仅为144m,误差在可接受范围内).船舶转向时航速越大,AIS数据时间间隔越小,即使存在数据丢失,也是可以接受的.
判断转向的方法为:取任意一段船舶航迹上时间间隔分别为300s和900s的点,计算相邻三点中第
一、第二点与第三点连线的夹角.如图3所示,∠AOB即为判断是否转向的夹角,若∠AOB≥10°,则认为船舶转向,且认为此时船舶的转向行为必考虑到与其实际通过距离小于5000m的船舶.
样本选取的过程中虽不能保证挑选出全部的样本,但能够保证选择的样本均为目标样本.通过计算,选择2107组样本数据.
2.2.3船舶领域的度量
船舶领域不同方位的边界到中心船的距离不同.为比较船舶领域样本的大小,将样本中中心船周围不同方位上的领域大小转换为相同方位上的领域大小.设船舶领域任意方位β上的边界到中心船的距离为dβ,尾部扇区长为l,中心船船首方向为0°,船尾为180°,左右对称.由于本文研究的水域为开阔水域,所以参考GOODWIN[2]开阔水域船舶领域模型中dβ与l的关系.设任意船舶领域样本均满足
2.3船舶领域影响因素
2.3.1船舶领域影响因素的确定
表1为参考文献[4]选取的开阔水域互见中船舶领域影响因素.
2.3.2船舶领域影响因素的离散化度量
离散化度量区间大小的划分直接影响研究的复杂度.不同因素之间划分粗细的不同则影响结果的
准确性,导致对不同船舶领域因素的分析产生误差.
综合考虑,划分影响因素为4个等价类,个别只能划分为3个等价类.影响因素划分规则如下:
(1)能见度.以3km为单位等间隔划分能见度,1=[10km,13km),2=[13km,16km),3=[16km,19km),4=[19km,22km].
(2)流.以1kn为单位等间隔划分流速,1=[1kn,2kn),2=[2kn,3kn),3=[3kn,4kn),4=[4kn,5kn].
(3)浪.以0.6m为单位等间隔划分浪高,1=[1.2m,1.8m),2=[1.8m,2.4m),3=[2.4m,3.0m),4=[3.0m,3.6m].
(4)风.以1级为单位等间隔划分风级数,1=[4级,5级),2=[5级,6级),3=[6级,7级),4=[7级,8级].
(5)会遇角度.会遇角度以本船为对象,左右对称,船头方向为0°,船尾为180°.参考会遇局面划分,1=[0,5°),2=[5°,54°),3=[54°,112.5°),4=[112.5°,180°].
(6)船舶密度.根据所观测的AIS数据,将水域内船舶密度相近的划分为一类,1={丹东、锦州、营口及天津与大连之间的水域},2={黄骅、东营、潍坊附近水域},3={大连、烟台、威海、龙口附近水域},4={天津港附近水域}.
(7)驾驶员级别.1={三副},2={二副},3={大副}.
(8)航速.以5.5kn为单位等间隔划分对地航速,1=[0kn,5.5kn),2=[5.5kn,11.0kn),3=[11.0kn,16.5kn),4=[16.5kn,22.0kn].
(9)船舶类型.按照船舶类型的特殊性划分,2={港口作业船和特种船舶},3={货船},4={油船和化学品},1={其他船舶}.
(10)船舶大小.以100m为单位等间隔划分船舶长度,1=[0,100m),2=[100m,200m),3=[200m,300m),4=[300m,400m].
船舶领域大小按照l的大小等间隔划分,1=[0,1250m),2=[1250m,2500m),3=[2500m,3750m),4=[3750m,5000m].
3数据挖掘
3.1船舶领域影响因素与船舶领域信息系统
在信息系统S=(U,R,V,f)中:U为样本空间;R=P∪Q;P为条件属性,对应船舶领域影响因素;Q为决策属性,对应船舶领域;V为U中样本值的集合,由f确定.[14]船舶领域影响因素与船舶领域决策见表2.
表2船舶领域影响因素与船舶领域决策
3.2影响因素之间依赖度和影响因素重要度计算
利用MATLAB对式(1)和(3)编程计算,过程如下:
①计算U/ai(ai∈P)和U/Q,划分规则如2.3.2节.
②计算U/P,即求P的等价类.
影响因素之间的依赖度计算结果见表3,影响因素重要度计算结果见图4.
表3船舶领域影响因素之间的依赖度
表3中第i行第j列的元素为影响因素j对影响因素i的依赖度,保留两位小数.可以看到,C1,C2,C3,C4之间的依赖度较大,A1与A2之间也存在一定程度的依赖关系,其余影响因素之间的依赖度均为0.图4中C1和C2的重要度都为0,C3的重要度近似为0,C4的重要度也较小,仅为0.0166.为进一步分析影响因素之间的依赖度对影响因素重要度的影响,将除去相互之间存在依赖关系的船舶领域影响因素重要度计算结果列于表4.
表4除去依赖关系的船舶领域影响因素重要度
从表4中第一行的结果可以看到,当除去A2时,与A2存在依赖关系的A1的重要度与图4中相比增大.从其他行也可以得到相同结论.比较不同行可以看到,当去掉不同的影响因素时,影响因素重要度排序发生改变,说明某些影响因素之间也是相互影响的,即影响因素之间存在冗余.这也说明利用基于粗糙集的属性重要度计算方法得到的影响因素重要度是每个影响因素相对于其他影响因素的重要度,所以将此重要度定义为相对重要度.因此,有必要针对影响因素之间的冗余进行约简.
3.3影响因素约简
根据属性重要度的定义和相对约简的定义,对任意的影响因素子集P′P,
①当P′的重要度为0时,必有
因此,当P′的重要度为0,P′+a的重要度不为0,且posP(Q)=posP-P′(Q)时,P-P′为P的Q约简;当P′重要度为0,任意影响因素a∈P-P′重要度不为0时,P′+a重要度必不为0.因此,利用船舶领域影响因素重要度求相对约简时,只需考虑重要度为0的因素.由图4,只需考虑C1,C2,C3(近似为0).图5为包含影响因素C1,C2,C3的可能删掉子集的重要度,其中属性重要度为0或近似为0,且最大子集为{C1}和{C2,C3}.计算可得

因此,可删掉C1或C2,C3.船舶领域影响因素的约简集合有两个,分别为R={会遇局面,船舶大小,航速,风,驾驶员级别,船舶密度,船舶类型,能见度}和S={会遇局面,船舶大小,航速,浪,流,驾驶员级别,船舶密度,船舶类型,能见度}.在影响因素中去掉风或去掉浪、流时,只有与其存在依赖关系的影响因素的重要度存在变化(见图6和7),证明了简约结果的有效性与合理性.
综合比较,在船舶领域的影响因素中,可以删掉风或浪、流,必要影响因素中会遇角度、航速、船舶大小、驾驶员级别、船舶密度的重要度分别为0.2791,0.2008,0.1794,0.2121,0.2359,均大于船舶类型和能见度的重要度(0.1229,0.0935).在保证对船舶领域影响因素分辨性不变的前提下,驾驶员可有重点地选择较重要因素对船舶领域进行判断,并采取较恰当的避碰行动,保障航行安全,但在特殊的环境下,某些影响因素需要特别考虑.
4结论
以渤海及黄海北部开阔水域AIS数据为基础,应用基于粗糙集的数据挖掘方法对互见中船舶领域影响因素进行了系统分析,发现影响因素对船舶领域的影响存在重叠信息.在全部的影响因素中,可删掉风或浪、流,会遇角度、航速、船舶大小、驾驶员级别、船舶密度的重要度分别为0.2791,0.2008,0.1794,0.2121,0.2359,大于船舶类型和能见度的重要度(0.1229,0.0935).结论可为确定船舶领域模型时选择合理的影响因素提供依据,也可降低驾驶员航行决策时考虑因素的复杂度.
参考文献:
[1]FUJIIY,TANAKAK.Trafficcapacity[J].TheJournalofNavigation,1971,24:543552.
[2]GOODWINEM.Astatisticalstudyofshipdomains[J].TheJournalofNavigation,1975,28:328344.
[3]范贤华,张庆年,周锋,等.水流条件下内河船舶领域模型[J].大连海事大学学报,2013,39(1):4648.
[4]PIETRZYKOWSKIZ,URIASZJ.Theshipdomainacriterionofnavigationalsafetyassessmentinanopenseaarea[J].TheJournalofNavigation,2009,62:93108.
[5]PIETRZYKOWSKIZ.Shipsfuzzydomainacriterionfornavigationalsafetyinnarrowfairways[J].TheJournalofNavigation,2008,61:499514.
[6]HANSENMG,JENSENTK,LEHNSCHILERT,etal.EmpiricalshipdomainbasedonAISdata[J].TheJournalofNavigation,2013,66:931940.
[7]WANGN.Anintelligentspatialcollisionriskbasedonthequaternionshipdomain[J].TheJournalofNavigation,2010,63:733749.
[8]WANGN.Aunifiedanalyticalframeworkforshipdomains[J].JournalofNavigation,2009,62:643655.
[9]WANGN.Anovelanalyticalframeworkfordynamicquaternionshipdomains[J].TheJournalofNavigation,2013,66:265281.
[10]WANGN,TANY,LIUSM.Shipdomaninindentificationusingfastandaccurateonlineselforganizingparsimoniousfuzzyneuralnetworks[C]∥Proceedingsofthe30thChinesecontrolconference.Yantai,China:ElsevierScience,2011:52715276.
[11]ZHUXL,XUHZ,LINJQ.Domainanditsmodelbasedonneuralnetworks[J].TheJournalofNavigation,2001,54:97103.
[12]张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2001:1217.
[13]郑中义,吴兆麟.船舶避碰的模糊决策[J].大连海事大学学报,1996,22(2):58.
[14]刘红,何鹏.基于粗糙集的海事事故影响因素分析[J].上海海事大学学报,2013,34(2):1722.