利用AIS数据计算港口间竞争度的方法

向哲 施朝健 胡勤友 杨春
摘要:
为能更有效地提供有价值的航运情报, 借鉴网络分析法相关原理,挖掘船舶AIS数据,获取港口之间的竞争度.该法通过船舶数据模型、港口数据模型、船舶抵达港口事件模型、船舶挂靠港记录、港口之间运力、港口网络等建立港口间竞争度模型. 选取2014年4—8月中国沿海船舶AIS数据和17个主要港口数据,利用模型计算出对上海港竞争度排名前三的港口依次是宁波港、张家港港和南通港.
关键词:
航海技术; 数据挖掘; AIS数据分析; 网络分析法; 挂靠港序列; 港口网络
中图分类号: U691.75
0 引 言
港口竞争度是指两港之间由于对方存在而损失的船舶运力的对比程度,用于衡量港口间竞争的关联关系.计算港口竞争度可有效帮助港口运营方衡量本港资源优势、优化港区资源配置,为港口、物流投资者提供决策支持.
对港口间关联关系的研究由来已久.LI等[1]提出港口间的物流能力是港口间最重要的关系,通过计算港区间的物流能力获得特定港口的合作、竞争度;SONG[2]和BARY等[3]在上述研究基础上加入了公路交通流等物流能力的考量;ZHENG[4]依据港口可持续发展的运力指数,提出一种使用所在区域的产值计算港口之间相互竞争关系的方法;YUAN等[5]研究了天津港附近港口的持续发展能力与天津港物流能力之间的关联关系;孔宪雷等[6]利用博弈模型进行分析,构建港区管理模型,挖掘并形成港区管理的序列模式;施欣[7]从港口内部结构和港口吞吐量的角度分析了港口的竞争行为;刘明君等[8]综合考虑了货源、道路运输成本、装卸成本和泊船成本,计算港口的运营成本;淦学甄等[9]结合黄骅港的布局、周边水域和风险,分析黄骅港的竞争力;刘娟娟[10]使用Stackelberg博弈理论,采用双层规划模型描述区域内各港口间的协调优化问题;XIANG等[11]提出一种计算相似航线船舶的方法,其情报可为特定的船舶所有人或者租船用户提供信息服务;郑海林等[12]在此基础上利用AIS数据计算出港口、泊位中船舶的平均搁置时间并计算各港口的拥塞指数,反映国内港口的通航、装卸效率,为港口投资者进行决策提供数据支持.
上述研究大多为定性分析,未给出计算港口间关联关系的方法;使用的数据往往来自已加工过的统计数据、工作报告和报表,因此缺乏精确性,统计起来也较为复杂,计算过程具有不可再现性.为解决上述问题,本文结合航运物流的特色、船舶AIS数据,并借鉴网络分析法相关原理[1316],挖掘并获取港口之间的竞争度,从而提供隐含的有价值的航运情报.
1 模型算法
1.1 基本原理和模型
海量AIS数据记录了船舶每时刻的经纬度、船舶尺寸、载重吨等信息.利用这些信息可提取船舶航行特征,从而计算船舶挂靠港记录;通过船舶的挂靠港记录可以分析该船一段时间内挂靠过的每个港口,根据挂靠船舶的数量和载重吨可计算每两个港口之间的运力;以运力信息作为衡量港口间关系强弱的基础,借鉴网络分析法相关原理(将港口设为网络节点,运力设为边),剔除运力较小的港口之后,分别统计航线上“经过港口B就不经过港口A”的船舶及其运力,可计算两个特定港口之间的竞争度.现将本文中的基本模型定义如下.
(1)船舶数据模型.从AIS数据中提取用于数据分析的船舶动态数据信息,包括船舶AIS数据发出的时刻、船舶的位置、载重吨等数据,可利用船舶移动识别号码(MMSI)作为船舶唯一标识.船舶x的数据模型可表示为
式中:m为船舶的MMSI;t为发出AIS数据的时刻;p为该时刻船舶的位置;d为船舶载重吨.
(2)港口数据模型.从海图数据信息中提取港界数据和港口名称.港口i的数据模型可表示为
式中:I为港口编号;s为港界多边形数据;n为港口名称.
(3)船舶抵达港口事件模型.统计抵达某港的船舶.船舶x抵达港口i的事件关系Txi表示为
事件模型Txi由船舶数据模型Sx和港口数据模型Pi运算得出,计算原理为:判断船舶是否处于港口边界内一段时间,若判断结果为“是”则表示该船抵达港口.其中“si中包含px”表示“判断船舶x位置是否处于港口i的边界内”.
(4)船舶挂靠港记录.汇总船舶抵达港口事件,可获取船舶挂靠港记录.记录表现为按时间排序的船舶抵达港口事件的序列,船舶x的挂靠港记录Lx可表示为
式中:Txi表示船舶x某时刻抵达港口i.
(5)提取两港之间运力.利用船舶挂靠港记录,选取记录中分别挂靠两港(分先后)的船舶,统计其数量和总载重吨即可获取港口之间运力,港口s和港口t间的运力可表示为
式中:sum表示累加挂靠过港口s和港口t的船舶的载重吨.
(6)港口网络.港口网络可利用港口数据模型和港口间运力构建,表示为
式(6)中网络G由节点集合V和边集合(即节点之间的关系集合)E构成,因此可设网络中所有节点为港口,网络节点的边为港口间的运力.港口网络可作为计算港口间竞争度的基础.
1.2 计算流程
利用AIS数据和中国部分港口数据,提取船舶数据模型、港口数据模型;计算船舶抵达港口事件并获取船舶的挂靠港记录;汇总、统计船舶挂靠港记录,提取港口之间的运力;利用港口数据、港口间运力将中国部分港口构建为港口网络(其中网络节点为港口,网络节点的边为港口间运力),剔除运力较小的节点和边后获取港口网络;通过统计所有航线上“经过港口B就不经过港口A”的船舶及其运力,揭示由于港口B的存在而导致的港口A的运力损失,以此为依据计算港口网络中各节点之间的竞争度.港口间竞争度计算流程见图1.
2 具体步骤
计算港口间竞争度的关键是获取港口网络.获取港口网络的步骤如下.
(1)计算船舶抵达港口事件.利用AIS船舶数据、港口数据,结合式(3)中的模型,可快速计算船舶抵达港口事件,从而获取抵港船舶信息,计算原理见图2.实际操作中,可设港口边界为G,获取T1时刻港口边界内的船舶集合S1和T2时刻港口边界内的船舶集合S2,则T1至T2内抵达港口船舶为S1-S2.图2中:在T1至T2内,船舶E为新出现在港口边界内的船舶,可视为抵港船舶;船舶D为消失在港口边界内的船舶,可视为离港船舶;船舶A,B和C为一直停留在港口边界内的船舶(即不是在T1至T2内抵达港口的船舶).
(2)获取船舶挂靠港记录.汇总船舶抵达港口事件,可获取船舶挂靠港记录.在实际操作中,由于在AIS数据中MMSI与船舶一一对应,因此只需按照船舶MMSI分组即可获取船舶挂靠港记录.
(3)获取两港间运力.利用船舶挂靠港记录,选取记录中分别挂靠两港(分先后)的船舶,汇总统计数量和总载重吨即可反映两港间运力.
(4)构建港口网络.利用式(6),将港口视为网络节点,港口间运力视为网络的边,运力的大小即为边的权重,可构建港口网络.选取包括上海港在内的17个中国港口,计算2014年4—8月船舶挂靠港记录,并获取港口间运力.表1所示为各港口至上海港的船舶运力统计,按载重吨大小排序.
利用网络分析中的中心度原则,累加计算其余港口到达本港的运力,统计获取该港节点的总运力,可构建港口网络.剔除港口总运力小于1 000万t的港口,将港口网络节点筛选为15个,见图3.图3中若某港总运力较大则表示该港在港口网络的总运力中承担得较多,地位也较“重要”.
3 计算竞争度
在获取了港口网络的基础上,利用本文算法可计算港口网络中各节点间的竞争度,其原理为:统计任意经过A和B两个港口的航线上“经过港口B就不经过港口A”的船舶及其运力,即统计由于港口B的存在而导致的港口A运力的损失,最终获取整个网络中“港口B对港口A的竞争度”.计算特定港口(A和B两个港口)间的竞争度分为两步.
3.1 单条航线(经过A和B两个港口)上两港间的竞争度
因此,可通过统计由于港口B的存在而导致的港口A运力的损失,获取在港口S至港口E的航线上港口B对港口A的竞争度,计算式为
式(7)中C(S,B,E)表示在港口S至港口E的航线上,由于港口B的存在而被分流的运力.式(7)的分母部分则表示除了其他港口转运运力外港口S至港口E的全部运力.式(7)中若无港口B(或者港口B运力为0),则剩余运力全由港口A承担,港口B对港口A的竞争度为0.由此可反映由于港口B的存在而导致的港口A运力的损失与从港口S至港口E的航线(经过A和B两个港口)运力的对比程度.
3.2 整个港口网络中两港间的竞争度
由式(7)可获取港口S至港口E的航线上港口B对港口A的竞争度(同理也可计算港口A对港口B的竞争度).整个网络中不止一条航线需要港口A和港口B的转运运力,可累加所有经过港口A和港口B的航线上港口B对港口A的竞争度,并除以这些航线的数量,从而获取整个港口网络中港口B对港口A的竞争度.计算公式为
式(8)中分母n表示所有经过港口A和港口B的航线数量.分子由港口网络中所有经过港口A和港口B的航线上港口B对港口A的竞争度累加获取(实际计算中,以所有港口为起点,所有港口为终点进行计算,若该航线不经过港口A和港口B则竞争度自然为0).
利用2014年4—8月我国港口的AIS数据,构建港口网络,并以上述算法获取上海港与其他14个港口间的竞争度,见表2.
从表2可看出,对上海港竞争度最高的3个港口为宁波港、张家港港和南通港,即由于上述3个港口的存在导致经过上海港的各航线运力损失(分流)得最多.
4 结束语
提出利用海量AIS数据快速获取船舶挂靠港记录的模型和实现方法;借鉴社会网络分析法相关原理,构建中国沿海网络图;利用网络图和统计算法,计算港口网络中特定港口节点间的竞争度.该竞争度反映了在港口网络中由于港口B的存在而导致的港口A运力的损失程度.在计算过程中使用了海量AIS数据使得结论真实性获得提高,此外,在计算竞争度和提取船舶挂靠港记录时使用了集合的快速提取方法,使得计算效率大大提高.该研究方法和结论可为港口运营方、投资方的决策提供数据支持.
今后的研究方向为利用海量AIS数据挖掘港口之间的合作度,船公司之间的竞争、合作度等.
参考文献:
[1]LI Shanshan, GAO Hong, LIU Wei. Research on ports group internal cocompetition based on social network analysis[C]//2013 IEEE International Conference on Service Operations and Logistics and Informatics, Dongguan, China: IEEE, 2013: 186191.
[2]SONG DongWook. Port coopetition in concept and practice[J]. Maritime Policy and Management, 2003, 30(1): 2944. DOI:10.1080/0308883032000051612.
[3]BARY Z, PIETRO B, PADIDEH G, et al. Port competition modeling including maritime, port, and hinterland characteristics[J]. Maritime Policy and Management, 2010, 37(3): 179194. DOI:10.1080/03088831003700579.
[4]ZHENG Hui. Evolution of Chinas port measurement of competitiveness[J]. Statistics and Decision, 2008(18): 110106.
[5]YUAN Qingmin, NING Ningning. Analysis the correlation of port logistics and regional sustainable development ability to Tianjin for example[C]//Applied Mechanics and Materials, 2013 International Conference on Renewable Energy and Environmental Technology, Jilin, China: Trans Tech Publications Ltd, 2013: 448453.
[6]孔宪雷, 许长新. 港口群系统的竞争合作与演变发展[J]. 水运工程, 2004, 10(10): 2831.
[7]施欣. 港口竞争的市场结构与竞争行为分析[J]. 中国航海, 1998, 21(2): 9093.
[8]刘明君, 常超凡, 黄勇, 等. 基于交通一体化的区域港口竞争模型[J]. 物流技术, 2007, 26(10): 4042.
[9]淦学甄, 刘虎. 黄骅港港口竞争力分析[J]. 物流工程与管理, 2010, 32(7): 110111.
[10]刘娟娟. 竞争环境下区域港口协调优化的双层规划模型[J]. 上海海事大学学报, 2006, 27(4): 4145.
[11]XIANG Zhe, LIU Ruru, HU Qinyou, et al. Applied research of route similarity analysis based on association rules[J].
TransNav, the International Journal on Marine Navigation & Safety of Sea Transportation, 2012, 6(2): 181185.
[12]郑海林, 向哲, 胡勤友. 基于AIS数据的区域性搁置船舶统计[J]. 中国航海, 2012, 35(4): 912.
[13]朱庆华, 李亮. 社会网络分析法及其在情报学中的应用[J]. 情报理论与实践, 2008, 31(2): 182187.
[14]陈萌, 汤志伟. 社会网络分析法在QQ群虚拟学习社区中的应用分析[J]. 电子科技大学学报, 2011, 13(3): 7477.
[15]程慧平, 余凡. 基于语义Web的社会网络分析应用模型研究[J]. 情报科学, 2011, 29(4): 616618.
[16]吴瑞. Web日志中模糊泛化关联规则的提取[J]. 情报学报, 2011, 30(2): 192197.
(编辑 贾裙平)