基于互联网的地震灾情信息分类编码与初步应用研究

张方浩 和仕芳 吕佳丽 邓树荣 白仙富 董翔



摘要:根据互联网地震灾情信息的特点,参考以往研究对灾情信息的分类情况,遵循已制定的信息分类编码的相关行业和国家标准,结合地震应急响应和处置的需求,紧紧围绕方便计算机存储、查询和使用,服务于灾情会商、影响场判定以及应急救援指挥决策工作的目的,采用最基本、最常用的线分类方法,将互联网地震灾情信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。在分类基础上,利用层次码编码方式,制定出适合实际应用的灾情信息编码规则和编码结构。以2014年云南鲁甸6.5级地震为例,利用互联网收集的灾情信息,进行分类编码及反演对比分析,结果表明,互联网地震灾情信息的灾区范围和受灾程度分布图,与实际调查发布的烈度分布图的范围和受灾程度较为接近,体现出本文分类体系和编码结构的实际作用和价值。
关键词:灾情信息;分类编码;互联网;鲁甸地震
中图分类号:P315-39 文献标识码:A 文章编号:1000-0666(2016)04-0664-09
0 引言
当破坏性地震发生后,第一时间需要了解灾区的破坏情况,包括人员伤亡、房屋破坏、生命线工程破坏、次生灾害等,这些信息通称为灾情信息。随着计算机和通信技术的飞速发展,特别是移动通信网络应用已日益普及,互联网以其时效性高、互动性强、海量信息、资源共享等诸多优势在信息传播中发挥着重要作用(朱艳,李文学,2011)。当地震发生后,大量信息会在互联网上迅速传播,来自互联网的灾情信息种类繁多、来源广泛、形式多样(徐敬海等,2010)。因此,如何建立一个合理的分类体系,如何制定一个科学的编码规则和结构,如何将这些多源复杂、离散异构的互联网灾情信息进行分类编码存储,通过计算机系统进行加工分析处理为应急响应提供参考,为抗震救灾提供服务,已成为应急信息服务中需要迫切解决的问题。
1 基于网络的地震灾情信息特点
通过对互联网中传播的地震灾情信息进行统计分析,发现其主要具有以下5个特点:
(1)信息内容的复杂性。由于互联网传播内容的自由度高,使得互联网所蕴涵的地震灾情信息内容更为复杂多样,一方面灾情信息内容涉及面多而广泛,包括人员伤亡、财产损失、生态环境破坏等,应急响应、救灾情况等信息与灾情信息并存。另一方面,互联网信息病毒式的传播模式增加灾情信息真实性辨别的难度,网络地震灾情信息虚虚实实、真假难辨。
(2)表达方式的随意性。互联网中传播的地震灾情表达形式较为口头化和随意化。由于灾情信息上报者主要是灾区当地政府部门、媒体、民众等,他们大多不是地震行业从事者,也没经过专业化培训,对科学规范标准的地震破坏、地震烈度等表达方式不熟悉,并且信息上报者文化、性别、年龄、所从事行业各有差异,上报的灾情信息表达方式参差不齐,最终呈现在互联网中的灾情信息表达形式多样随意性较大。
(3)传播载体的多样性。互联网中地震灾情信息的传播载体兼具文本、表格、图片、语音、视频等富媒体模式。在移动智能终端的广泛普及下,无线网络覆盖范围越来越广,基于互联网的地震灾情信息已不局限于图文方式,在地震发生后各种文字、图形、音视频等多媒体灾情信息在互联网中广泛传播。
(4)传播速度的及时性。基于互联网的地震灾情信息的获取和传播具有快捷方便的特性。建立在互联网中传播的所有灾情信息都是数字化的,其生成过程和传播速度都较快。不同的信息形式可以方便地互相转化,运用多媒体技术把图文、表格、声音、视频有机地结合起来,多媒体化的信息生动、形象,增强了传播内容的感染力和真实性。信息通过互联网可以及时、全方位的反复传播,使人们很容易在较短的时间内受到影响。
(5)影响效果的交互性。基于互联网的地震灾情信息传播的方式已不再是单向行为,在信息传播过程中,人们不再是单纯的受众,他们可以在收到灾情信息后,及时反馈自己感知或掌握的信息,并可与许多人在网络上相互交流和互动,这过程中产生的信息各式各样,由于个人感知和掌握的信息不一,导致信息在交互传递中发生偏差,真假难辨。
2 基于互联网的地震灾情信息分类
2.1 分类目的
对地震灾情信息分类的目标是实现从多源异构和纷繁复杂的信息中摘取受灾程度信息,快速形成灾区范围和受灾程度评估图,以便尽快采取合理的地震应急决策和救援力量部署。根据互联网灾情信息多源异构、离散复杂的特点,按照设定的原则和方法对不同网络渠道上基于不同方法获得的灾情信息进行科学分类,解决灾情信息的界定问题,如哪些属于地震灾情信息;哪些是地震后出现频度最高、出现最及时、对评估受灾范围和程度最有效的灾情信息。通过分类,将这些口头化、随意化的互联网灾情信息与规范的学术化、标准化的地震烈度、破坏等级关联起来。本文所研究的灾情信息分类就是要在标准规范和市井大众之间建立一座桥梁,把市井大众的互联网灾情信息最终转为标准规范的地震破坏等级或地震烈度。
2.2 分类原则与方法
互联网地震灾情信息具有复杂、多样、随意的特点,其信息分类既要遵循《信息分类和编码的基本原则与方法》(GB/T 7027—2002),也要兼顾灵活性和实用性。根据地震灾情信息的复杂特征和标准体系研究的特征,要求地震灾情信息的分类体系既要有系统性、确定性特征,又要有可扩充性的特点。因此分类按下列原则进行(白仙富等,2010):①实用性原则:分类的主旨是为地震灾情会商服务,这些信息要能为地震受灾范围和程度快速圈定服务;②习惯性原则:考虑灾情信息分类不是针对专业、行业化的信息分类,面对的是多源异构、不规范、不专业的信息,是针对习惯的、日常的、大众的信息分类,为了分类结果与信息来源的高度匹配,分类时特别考虑这些信息在日常使用或出现的习惯性;③精简性原则:同一类灾情信息从逻辑上可能涵盖无数条下一个层级的信息,在分类时从使用的角度出发,紧紧抓住灾情这一关键指标,而且是地震发生后在不同层面上出现频率最多的信息;④兼容性原则:充分考虑国内已有地震信息或者其他相关信息的继承性和实际使用的延续性;⑤可扩展性原则:互联网灾情信息来源越来越广、内容越来越多、传播技术手段越来越先进等特点,应为新技术应用产出信息及新需求的分类保留扩展能力。分类方法参考以往研究对灾情信息的分类情况,结合互联网地震灾情信息特征及应用需求的特点,采用最基本、最常用的线分类方法(刘植婷,2004),按选定对象(关键词)的属性作为划分基础,将其逐次地分成相应的类目。
2.3 分类结果
互联网地震灾情信息分为震感信息、人员伤亡信息、房屋破坏信息、生命线工程破坏信息(包括电力、通信、交通、供排水、水利工程、燃气、输油系统)、地震地质灾害信息、其他次生灾害信息(苏桂武等,2003)共6个大类。
震感信息是指地震发生时人的直观感受和看到的器物反映,不同烈度区人的感觉不一样,比如明显震感、头晕、惊醒、惊慌、摇晃、颠簸、抛起、摔倒等这些感觉;同样,在不同的地震下器物反应也不一样,比如悬挂物摆动、门窗作响、器皿翻落、铁轨弯曲等。
人员伤亡信息是指因地震直接或间接造成的人员伤亡信息,包括死亡、失踪、重伤和轻伤信息。人员伤亡信息是最为关注的灾情信息,也是地震发生后来源最多、流传最广的信息。
房屋破坏信息是地震造成的不同使用类型的房屋的破坏信息。地震后从不同渠道得到房屋破坏信息主要为民房、学校、医院、其他公房、厂房、寺庙、棚圈等破坏信息。
生命线工程破坏信息主要包括电力系统、通信系统、交通系统、供排水系统、水利工程、燃气系统、输油系统等破坏信息。
地震地质灾害信息是由地震引起的次生地质灾害或灾害链信息,最为常见的有滑坡、崩塌、滚石、落石、塌方、堰塞湖、喷砂冒水、地裂、塌陷等,在实际调查工作中,往往把崩塌、滚石也都归并到滑坡中。
其他次生灾害信息是指地震引起的非地质类的次生灾害,比如水灾、火灾、毒气、爆炸、放射性污染等。但是,这一类信息往往和地震烈度没有很明显的关联关系,但作为灾情信息分类的完整性和灾情信息的特征看,这些灾情信息也是来源比较多、传播比较远、影响比较大的对地震受灾范围和程度的判断也有辅助作用。
基于互联网的地震灾情信息分类如表1所示。
3 基于互联网的地震灾情信息编码
3.1 编码目的
针对互联网中获取的地震灾情信息具有复杂多样、分散异构、交互兼容的特点,编码的目的是利用通俗简单的字符串和数据描述语言表来代替复杂异构的互联网地震灾情信息,建立一套标准化、规范化的灾情信息编码机制,实现灾情信息的科学化、标准化、通用化管理(曹彦波等,2010),为计算机系统实现互联网地震灾情信息分类存储、统计查询、分析研判等功能提供技术基础,在地震应急响应中能快速、高效、有序地开展灾情汇集、处理、分析工作,从而有效提高灾情信息服务保障能力(聂高众等,2012),使其更好地服务于灾情会商、影响场判定以及应急救援指挥决策工作。
3.2 编码原则
在对互联网地震灾情信息编码过程中,应紧紧围绕方便计算机存储、查询和使用,服务于灾情会商、影响场判定的目的,结合互联网地震灾情信息特征及应用需求的特点,通过对互联网地震灾情信息关键词和程度词进行分析与规范,制定出适合实际应用的互联网灾情信息编码规则,本文按下列原则进行编码:①唯一性:在互联网地震灾情信息编码体系中,每一条灾情信息仅对应一个代码,编码所表示的对象或对象集合必须具有唯一性(马晓萍等,2002);②合理性:互联网地震灾情信息编码结构要与其分类体系相适应;③实用性:设计的代码要尽可能地反映编码对象的特点,有助记忆,易识别,便于计算机系统进行处理和使用;④灵活性:编码要具有灵活性,当新增或删除一个分类的编码时,不应影响整体的编码体系;⑤可扩展性:编码结构要具有可扩充性,结合地震灾情信息来源越来越广、信息量越来越大、技术手段越来越先进的特点,以及移动互联网、大数据、云计算、物联网等新技术的迅猛发展,应为新技术应用产出信息的编码留有余地,保证其扩展能力。
3.3 编码方法
利用层次码编码方式设计的互联网地震灾情信息代码由类别码和描述码共同组成。类别码表示地震灾情信息的类别标识,类别码有大类码和小类码之分,用于唯一地标识受地震影响的元素类别;描述码是对某类物体受灾情况进行描述,反映了受影响的元素的破坏程度(郑向向,帅向华,2012)。
3.4 编码结构
灾情代码结构如图1所示。第一位是大类码,它表示地震造成破坏的大类,如震感、人员伤亡、房屋破坏等;第二位是小类码,代表了遭受破坏的某一大类下面的小类,如房屋破坏下的民房、教育系统、卫生系统等不同行业房屋的破坏情况;第三位是描述码,描述受到地震影响物体的破坏程度。
在灾情编码中,类别码由大类码和小类码组成,类别码代表对应的灾情类别,为两位字母,第一位为大类码,第二位为小类码,如仅有一类,则小类码用a表示;描述码代表物体受地震影响的破坏程度,由一位数字组成。互联网地震灾情信息编码如表2所示。
4 实际应用
2014年8月3日在云南省昭通市鲁甸县发生6.5级地震,在这次地震应急工作中,我们依托云南省地震应急指挥中心技术系统,利用灾情信息收集平台,快速在网络上收集震感、人员伤亡、房屋破坏等灾情信息,共计收到各类灾情信息309条,其中震感信息17条、人员伤亡信息119条、房屋破坏信息68条、生命线工程破坏66条、地质灾害35条、其他灾害信息4条。将收集到的灾情按照本文提出的互联网地震灾情信息分类体系和编码结构,进行分类编码。根据每一条灾情的关键词和受灾程度,按照上述分类体系中每类灾情信息的5种受灾程度,用编码结构中的1~5表示,其中1代表一般灾区、2代表轻灾区、3代表中等灾区、4代表重灾区、5代表极重灾区,大致对应地震烈度的Ⅵ、Ⅶ、Ⅷ、Ⅸ、Ⅹ度。结合灾情信息的地理位置,利用聚类分析、插值分析等一系列空间处理算法模型在GIS平台上反演本次地震造成的受灾范围和受灾程度分布图,并与中国地震局发布的地震烈度分布图做对比,如图2所示。
由图2可见,通过分类标注和绘制的基于互联网地震灾情信息的灾区范围和受灾程度分布图,与实际调查发布的烈度分布图的范围和受灾程度较为接近,基本满足地震应急评估需求。地震发生后,通过计算机系统在互联网上快速开展灾情信息收集、分类编码、分析研判工作,为参与地震应急的部门和单位快速提供可视化的灾区范围图,体现出互联网地震灾情信息分类体系和编码结构的实际作用和价值。
5 结语
互联网地震灾情信息分类的核心目标是实现在互联网地震灾情信息与地震破坏等级或地震烈度之间建立桥梁,将口头化、随意化的互联网灾情信息与规范的学术化、标准化的地震烈度、破坏等级关联起来,既解决了灾情信息界定和分类问题,又解决了受灾严重程度区分问题。互联网地震灾情信息编码的核心目标是将复杂异构的互联网地震灾情信息转换为计算机系统能识别的语言,为计算机系统实现灾情信息分类存储、统计查询、分析研判等功能提供技术基础。同时提高互联网灾情信息处理能力,快速产出灾情信息服务产品,使其更好地服务于灾情会商、影响场判定以及应急救援指挥决策工作。
互联网地震灾情信息分类和编码成果在鲁甸地震中的初步应用体现出了分类体系和编码结构的实际作用和价值。分类和编码成果可应用于地震应急响应、处置和决策的灾情信息汇集处理、分析研判工作,提高灾情信息服务保障能力,还可以依据分类体系和编码结构充分利用互联网开展灾情速报。基于互联网的地震灾情信息分类编码方法目前还处于初步研究阶段,灾情的种类和描述有待于进一步研究和扩充,灾情的受灾程度与地震烈度的对应关系需要在实震应用中不断改进和完善,以便其更好的在灾情信息处理分析和应急指挥决策中发挥作用。
参考文献:
白仙富,李永强,陈建华等.2010.地震应急现场信息分类初步研究.地震研究,33(1):111-118.
曹彦波,李永强,胡秀玉等.2010.地震现场灾情信息编码研究.地震研究,33(3):344-348.
刘植婷.2004.信息分类编码标准化研究综述.世界标准化与质量管理,(4):50-52.
马晓萍,肖学年,张坤.2002.基础地理信息分类与编码原则和方法研究.测绘标准化,(1):1-5.
聂高众,安基文,邓砚.2012.地震应急灾情服务进展.地震地质,34(4):782-791.
苏桂武,聂高众,高建国.2003.地震应急信息的特征、分类与作用.地震,23(3):27-35.
徐敬海,聂高众,刘伟庆等.2010.多源异构地震灾情分类与编码研究.灾害学,25(增刊1):286-290.
郑向向,帅向华.2012.地震灾情短信编码的初步研究.自然灾害学报,21(1):92-100.
朱艳,李文学.2011.新媒体语境下政府信息公开与制度建设.新闻传播,(8):62.GB/T 7027—2002,信息分类和编码的基本原则与方法.