浅谈1∶2000DLG数据入库质量检查

王子豪 华建新
摘 要 针对湖南省不动产统一登记基础数据建设项目中1:2000DLG(数字线划图)数据入库质量检查内容繁杂、过程繁琐的问题,研究总结出了入库质量检查的内容、方法、方式和流程,并开发了检查软件。应用结果表明,这些措施有效提高了DLG数据入库质量检查的准确性和效率。
关键词 1∶2000DLG;质量检查;数据入库
中图分类号:P208 文献标识码:A
Abstract: In view of the complicated and cumbersome problems in the quality inspection of 1∶2000DLG (Digital Line Graphic) data in the construction project of real estate unified registration fundamental data in Hunan, the contents, methods, modes and processes of the quality inspection are summarized, and the inspection software is developed. The application results show that these measures effectively improve the accuracy and efficiency of DLG data loading quality inspection.
Keywords: 1∶2000DLG; quality inspection; data loading
1 引言
为满足湖南省不动产统一登记工作中农村不动产权籍调查等工作的需要,湖南省于2014年启动了不动产统一登记基础数据建设项目,项目用3年的时间,获取全省优于0.2米分辨率的航空影像,并采用航测方法测制1∶2000 DOM(Digital Orthophoto Map)和DLG。项目最终数据成果采用数据库管理系统进行统一管理和应用服务。
DLG数据作为矢量数据集,由于人为或非人为的原因,人工采集或编辑后的DLG数据总会与源数据产生一定误差,并且数据加工的过程中由于误差传播会进一步扩大误差[1]。经“二级检查一级验收”[2][3]后,仍可能存在不满足数据入库相关技术规定的质量问题,因此必须在入库前进行质量检查。
DLG数据质量检查是DLG数据入库过程中最重要的工作内容之一[4]。全省1∶2000DLG數据入库质量检查技术复杂,工作量大[5],为保证数据质量和项目进度,有必要在深入分析数据建设技术规定、数据标准、建库要求等档的基础上,结合数据实际情况,研究1∶2000DLG数据入库质量检查的内容、方法、方式、流程和实现技术,从而提高DLG数据质量检查的准确性和效率。
2 数据概况
湖南省不动产统一登记基础数据建设项目中的1∶2000DLG成果数据,基于立体像对,通过立体采集获取。首先以1∶2000标准图幅为采集单元,再通过接边融合形成以摄区(航空摄影测量时划分的区域)为单元的数据成果,最后通过裁切、接边融合形成以县级行政区划为单元的DLG入库数据。主要涉及水系及附属设施、居民地及设施、交通、管线、境界与政区、地貌、植被、地名等8个大类,169个子类地理要素,覆盖湖南全省范围(城镇范围和部分敏感区域除外)。
1∶2000DLG数据采集精度要求高,平原丘陵地区平面中误差1.2米,山区高山区平面中误差1.6米。采集要素种类多,除境界与政区的5个子类外,需要采集164个子类的地理要素。成果数据量大,Geodatabase格式的数据文件总大小在70GB左右。该数据为图库一体化数据,即要求入库数据通过投影、裁切和格式转换后(转换为dwg格式),经软件直接进行AutoCAD制图,因此需要对DLG数据的表征质量问题进行重点检查。
3 主要检查内容
GIS 数据质量是指GIS 数据适用于不同应用的能力。通常用GIS 数据的误差和正确率来度量,由数据质量元素来描述[1]。质量元素是指说明质量的定量、定性组成部分,即成果满足规定要求和使用目的的基本特性[2][6]。国家标准[2]将数字测绘成果的质量元素归纳为空间参考系、位置精度、属性精度、完整性、逻辑一致性、时间精度、影像栅格质量、表征质量、附件质量等9类,并细分为24类质量子元素。
数据质量要求决定检查内容。经过深入分析数据建设技术规定、数据标准、建库要求等项目档,以及数据实际情况,根据国家标准[2],全省1∶2000DLG数据入库前,需要检查的质量元素包括空间参考系、位置精度、属性精度、完整性、逻辑一致性、表征质量以及附件质量,主要检查内容总结归纳如下:
1、空间参考系。检查所有图层数据的大地基准和高程基准是否符合技术规定的要求。该数据空间参考系为2000国家大地坐标系和1985国家高程基准。
2、位置精度。入库检查主要检查矢量接边中的平面精度问题,包括缝隙、偏移等问题。
3、属性精度。要素分类代码值合法;属性值内容符合数据标准,在值域内,不得含有非法的空格、TAB等字符,不得含有Z值;属性接边。
4、完整性。要素不存在多余、遗漏问题,图层不存在重复、缺失等问题。
5、逻辑一致性。概念一致性,包括属性项的名称、类型、长度、顺序、个数等正确,要素CODE码与图层一致;拓扑一致性,包括要素重合、重复、错误的伪节点、错误的悬挂点、微小狭长面缝隙、闭合、自相交、打断、覆盖(被线要素的端点覆盖、被线要素覆盖、被面要素的边界覆盖、完全位于面要素内)等内容。
6、表征质量。几何异常(极小的不合理面或极短的不合理线、折刺、回头线、粘连等);方向特征(有向点和有向线的方向、面边线的方向、坡顶坡脚首尾相连顺时针成对闭合);多部件;弧形线与弧形面边线。
7、附件质量。附属文档完整正确、元数据的项和内容无错漏。
4 检查方法与流程
4.1检查方法
国家标准[2]中提出的质量检查主要方法有三种,即参考数据比对、野外实测、内部检查。
项目主要采用内部检查法检查数据的内在特性。对于一些采用内部检查法难以确定质量问题以及难以分析出错误原因的情形,如沟渠与房屋重叠、成片多个要素无接边对象等,需要结合参考数据比对法,调取项目成果中相应位置的1∶2000数字正射影像图进行比对,来确定DLG数据是否存在质量问题,并对有问题的数据提出相应的修改意见。如沟渠与房屋重叠时,通过影像来决定是删除错采的房屋或是补采水系附属设施;成片多个要素无接边对象时,通过影像来判断是否因为影像获取时间不同造成地物不接边,如果是则可以按照相关技术规定不进行接边处理。
4.2检查方式
数字测绘成果质量检查的方式主要有三种,即计算机自动检查、计算机辅助检查、人工检查[2],不同的检查方法具有各自的优势[7]。项目针对不同问题分别采取相应的检查方式。
1、计算机自动检查
通过编写算法程序, 利用数据的图形与图形、图形与属性、属性与属性之间存在的空间关系和逻辑规律, 检查并发现数据中存在的错误。如空间参考系、属性精度(但属性接边需要采用计算机辅助检查)、完整性(图层完整性、能通过拓扑关系发现遗漏的情形,如硬化空地缺少高程点)、概念一致性、多部件、弧形线与面边线、元数据等检查内容。
2、计算机辅助检查
由于矢量数据关系复杂,数据中很多情形程序检查不能完全确定其正确与否, 但程序检查能将有疑点的地方搜索出来, 缩小范围或精确定位, 再采用人机交互检查方法, 由人工判断数据的正确性。需要辅助检查的情形有:
(1)接边中的位置精度和属性精度问题。因接边处多个要素靠得太近,存在程序误报情形,需要辅助检查。
(2)拓扑一致性。由于地物关系情形复杂,难以用规定的几种拓扑关系涵盖所有的地物关系,比如水系伪节点,在分水处或汇水处合理,坎与水系面重叠,但有输水渡槽、涵洞等水系附属设施的情形合理,相邻斜坡的坡脚线重叠合理等情形,因此程序自动检查出来的拓扑错误需要辅助检查。
(3)几何异常。大部分几何异常不需要辅助检查,但有一些特殊情形需要排除,如房屋之间的极小缝隙面,起封闭作用的极短地类界线。
(4)方向特征。有向线中依比例干堤、路堤、路堑、斜坡等要素的坡底线在坡顶线的方向的右侧,首尾相连,形成闭合,但台地(坡顶线逆时针闭合,坡脚线顺时针闭合)和洼地(坡顶线顺时针闭合,坡脚线逆时针闭合)情形特殊需要辅助检查。ArcGIS数据结构中面的外边线的节点为顺时针排列,内环(空洞)的节点为逆时针排列,如果采集时方向错误,直接制图时会生成错误的符号。需要检查面边线方向的要素有依比例输水渡槽、依比例涵洞、滚水坝、拦水坝、面状水闸、船闸、悬空通廊、台阶、桥梁等,如图1所示。由于这些面边线方向的检查,需要结合相邻地物如河流、沟渠、房屋、道路,才能判断方向,且因采集节点捕捉不到位以及相交等复杂情形,需要辅助检查。
3、人工检查
不能通过软件检查,只能通过人工检查核对实物、数据表格或可视化图形,判断检查内容的正确性。比如数据完整性问题(可能出现的个别区域漏采了全部要素),接边处中断的坡顶坡脚方向一致性问题,附件文档质量问题。
4.3检查软件设计
计算机自动检查和计算机辅助检查方式首先需要有检查软件,根据数据检查要求,开发了专门的检查软件。检查软件基于ArcGIS平台的Add-In技术,采用.NET编程语言对ArcGIS桌面系统进行定制与扩展。
检查软件功能主要分为辅助检查模块、数据检查模块。
质检工作开始前,可先使用辅助检查模块对数据进行处理。模块功能包括:定义空间参考系、批量修复几何问题、批量拆分多部件要素、修改弧形要素、批量裁切(不改变面边线的方向)、调整面边线的方向、批量调整斜坡坡顶坡脚线方向、调整水系有向线方向、批量属性赋空值、接边融合、要素符号化等。
数据检查模块对数据进行批量化检查,模块功能包括:数据内部检查(空间参考系、位置精度、属性精度、完整性、逻辑一致性、表征质量等)、数据接边检查、元数据检查。
检查软件采用Add-In技术,方便质检工作人员使用ArcGIS桌面平台现有的各类功能,对数据进行管理和编辑,又可直接调用本检查软件,对数据进行处理和检查。
检查软件具有完善的检查结果记录和错误定位功能,执行完每一个检查步骤后, 软件自动将检查的结果和运行时间都自动记录在Shapefile文件和Log文件中,利用这些信息,可以直接对每一个检查结果进行定位、人机交互检查、编辑修改。
4.4检查流程
数据按摄区划分给不同的生产单位,由于生产单位较多,一个摄区数据接边问题的修改常涉及多家生产单位,以及作业人员对错误结果理解及修改熟练程度等原因,往往需要检查、修改、再检查,甚至需要多轮检查与修改才能修改到位,因此需要制定合理的检查流程,避免因多轮的检查与修改带来混乱。DLG数据入库检查作业流程如图2所示。
现以常德测区(140205摄区)数据为例,按以下步骤完成数据质量检查:
第一步、对摄区数据进行整理。按“生产单位-摄区-各修改版本数据”的文件结构进行数据整理存放,文件名为0720常德测区(140205摄区)DLG2000.gdb,其中0720为数据修改版本编号;
第二步、计算机批处理。采用检查软件的辅助检查模块,对数据进行定义空间参考系、修复几何、拆分多部件要素、修改弧形要素、调整面边线的起点、调整斜坡坡顶坡脚线方向、调整水系有向线方向等处理工作;
第三步、计算机自动检查。采用检查软件的数据检查模块对数据进行批量化自动检查,得出检查结果;
第四步、辅助检查和人工检查。采用ArcMap打开摄区数据和程序自动检查结果,核实检查结果,排除程序误报,添加人工检查出来的错误;
最后将人工核实后的检查结果整理反馈给生产单位。收到生产单位修改提交的成果后按照上述流程进行检查,直到解决了所有检查出来的质量问题。
5结束语
湖南省不动产统一登記基础数据建设项目实现了1∶2000 DOM和DLG全省覆盖,在湖南省是第一次,在全国也属前列,具有重大意义。本文总结的1∶2000DLG入库质量检查内容涵盖了各类型质量问题,并结合了检查方法及检查方式。经过一年多的项目实际应用,本文总结的检查方法和流程,以及开发的检查软件,使得检查准确性和检查效率都得到了极大提高,可以为类似比例尺的省级大型测绘项目中的DLG数据入库质量检查提供参考与借鉴。
参考文献/References
[1]李诺夫.GIS数据质量控制方法探讨[J].测绘通报,2011(8):66-68.
[2] 国家质量监督检验检疫总局,中国国家标准化管理委员会.GB/T18316-2008数字测绘成果质量检查与验收[S].北京:中国标准出版社,2008.
[3] 付海军.1:2000DLG数据的质量控制与质量评定[J].中国地名,2010 (03) :70-71.
[4] 文琳,聂赞.城市DLG入库数据的质量控制[J].地理空间信息,2013,11(4) :116-118.
[5] 张岚.1:10000DLG入库前数据质量检查的探讨[J].浙江测绘,2008 (2) :12-13.
[6] 曾衍伟,龚健雅.空间数据质量控制与评价方法及实现技术[J].武汉大学学报·信息科学版,2004(8): 686-689.
[7] 刘建军,王东华,商瑶玲.国家1:50000DLG数据库质量检查软件的设计和开发[J].地理信息世界,2006(04) :23-26.