面向航空制造业数据挖掘的数据源结构研究

    孙宏强 李源 曹云 张聪

    

    

    

    摘要:航空企业的信息化系统已经积累了大量的科研生产数据,利用数据挖掘技术,可以从这些大量的、无关联的数据中,提取出对科研生产有益的知识和信息,在数据挖掘的数据预处理阶段,对原始信息进行获取、数据清洗、数据抽取及数据交换,完成数据源结构的建立。该文通过对企业现有信息化系统中数据的梳理、分析各数据源的主键及关系,搭建了数据源框架,形成了数据源报表清单。

    关键词:数据挖掘;数据源框架;数据结构

    中图分类号:TP311文献标识码:A

    文章编号:1009-3044(2021)18-0036-02

    开放科学(资源服务)标识码(OSID):

    航空企业经过数十年的发展,信息化系统的应用在科研生产过程的各个环节中逐步成熟。从物资采购配送、产品科研数据、生产控制管理等信息化系统中,已经积累了大量的科研生产数据,然而这些数据相互独立于各自的信息系统中,数据来源具有多样性和分散性。利用数据挖掘技术,可以从这些大量的、无关联的数据中,提取出对科研生产有益的知识和信息,提供决策支持。在数据挖掘的数据预处理阶段,对原始信息进行获取、数据清洗、数据抽取及数据交换,完成数据源结构的建立。

    1 数据挖掘中的数据预处理

    数据挖掘技术是从海量的数据中提取出更为高效、更为新颖、更具潜在应用价值的知识和信息。数据挖掘中的数据来源是非常广泛的,包含面向关系数据库、数据仓库、非结构化或半结构化文本数据、图片视频音频等多媒体数据、Web数据以及空间数据库和时间序列数据库等复杂类型的数据。数据挖掘的流程是从数据预处理、数据挖掘到模式评估和知识表示,其中数据的预处理过程包含了数据清洗、数据变换、数据集成、数据简化等。在预处理的过程中,需要完成数据除噪、非法数值处理、冗余数据消除、数据格式转换等数据操作。得到预处理数据之后,就可以利用数据挖掘的技术,对这些数据进行数据挖掘和评估表示。由此可见,数据的预处理是数据挖掘技术的基础,数据源结构直接影响挖掘模型的可靠性及决策的正确性。

    2 航空制造企业的信息化系统

    随着“中国制造2025”的提出,航空装备制造企业迎来了新的技术变革和重大挑战,我们将依托较强的信息产业实力,通过工业化与信息化的深度融合,实现建成制造强国的战略目标。由于现代企业运营管理理念的进步和航空制造技术的提升,信息技术及生产过程数据积累在制造企业的价值越来越大,航空企业也越来越注重从企业生产数据中获取可以辅助其进行长期决策的有价值的信息。为提高企业运营效率、及时识别企业风险、积累产品知识,已逐步建立起完整的企业级资源统筹和制造过程管理的信息化平台。

    以某航空企业信息化系统建设为例,如图1所示,企业实施了TCP项目管理系统,实现了科研计划管理及生产计划管理,根据PDM产品数据管理系统中的BOM清单,在MSM元器件采购系统中生成采购计划,进行元器件订货筛选、合同报价、缺件反馈等元器件管理,在MES系统中完成电装配送、机加生产、部件调试等生产制造过程管理,半成品和成品进入PIM检验系统中完成半成品检验和过程检验,通过BPM流程管理系统完成产品的试验、所检及军检流程,入成品库。多个信息系统的集成实现了从项目计划、产品设计及数据管理、物料齐套、工艺生产执行的全过程管理,同时集成QMS质量管理系统,实现了生产过程及售后的故障报告及归零数据规范化、信息化。多个信息系统的部署将产品生产周期中产生的设计、生产、检验、质量等数据实现了结构化存储,为企业数据挖掘提供了初始数据。

    3 数据源框架

    数据源是数据挖掘技术的基础,在企业信息化系统结构化数据的基础之上,构建一个结构通用、可扩展的数据源框架,有利于企业获取更多有用的价值信息,同时也能识别出各信息系统之间数据关系,并提供一种数据源构建思路,为后期信息化发展提供更为有效的建设目标。

    3.1 信息系统中的数据结构

    企业现有的信息系统,从经营管理、产品数据、生产管理三个层面可概括为企业资源数据、产品数据、生产过程数据。其中,企业资源数据涵盖项目计划、物料采购、库存、任务管理、质量管理等,产品数据涵盖BOM清单管理、图纸文档协议等,生产过程数据涵盖生产计划管理、生产进度管理、生产异常处理、工艺路线规划、生产任务执行过程等数据。

    在TCP项目管理系统中生成项目计划,项目计划以课题代号为主键,计划信息包含计划名称、产品型号、研制阶段、产品代号、计划类型、承担人、承担部门、计划数量、计划下达时间、要求完成时间、实际完成时间等信息,项目计划可拆分生成二级计划,课题代号为主键。根据计划信息,可对承担人下发计划任务,在任务信息中可汇报项目执行信息。科研计划根据项目计划要求在PDM产品数据管理系统中提交相应的产品结构数据、图纸文档、协议文件、生成BOM清单,PDM产品数据管理系统中,以产品代号即产品图纸代号和研制阶段为主键,对产品数据进行管理。生产计划根据项目计划要求生成生产任务,按照产品型号、类型及计划生产数量自动生成生产指令号,生产指令号为产品生产过程中的主键,编号规则可体现计划完成时间信息及计划数量信息,可向上关联至项目计划中的课题代号,向下贯通整个生产流程中产生的结构化数据。生产计划从PDM产品数据管理系统中匹配产品代号及研制阶段读取BOM清单,在MSM元器件采购系统中生成采购计划,完成到货和元器件筛选工作,进行缺件管理,MSM系统中以采购计划及元器件代号为主键。在MES生产制造执行系统中生成电装配送计划、机加生产计划及部件调试计划,均以生产指令号为主键。在PIM检验管理系统中完成半成品检验和过程检验,在BPM系统中完成产品试验、所检、军检流程,在库存管理系统中完成出入库管理,均以生产指令号为主键。在产品流转过程中出现质量问题则与质量管理系统产生数据交互,以产品编号和生产指令号为主键。

    3.2 建立基础数据报表

    根据产品数据管理系统、生产制造执行系统、流程管理系统等多个系统的功能和业务环节,确定了各系统中数据源,形成了数据源报表如表1。

    3.3生成数据源框架

    基于上文得出的数据源报表,结合各系统之间的业务逻辑,挖掘数据之间的关联关系,建立了数据源框架。由TCP项目管理系统中的生产交付需求作为数据发起源,根据交付需求所提供的产品型号、研制阶段、交付需求数量等信息,在生产计划管理系统中创建生产计划,确定投产数量及计划完成时间,结合PDM系统中获取的产品的BOM结构,生成物料需求计划,物料需求计划以元器件代号及生产指令号为主键,汇总物料需求计划,在MSM元器件采购系统中生成采购信息,生成采购订单号,上报缺件时以元器件代號及生产指令号为主键。投产进入MES系统中后,生成产品编号,在每个生产环节生成相应的单号,以产品编号、生产指令号、单号为主键。进入检验阶段后,以产品编号、生产指令号、检验单号为主键。进入出入库阶段后,以产品编号、生产指令号、出入库单号为主键。以此构成了数据源框架。

    4 结束语

    本文基于对TCP、BPM、MES、BPM等企业现有信息化系统中数据的梳理,形成了数据源报表清单,同时通过分析各数据源的主键及关系搭建了数据源框架,阐述了各数据之间的关联关系。通过对数据源框架的设计,实现了数据挖掘的数据预处理准备,提高了挖掘模型的可靠性及决策的正确性。

    参考文献:

    [1] 梁凡.关于数据挖掘技术及其应用的分析[J].电子技术与软件工程,2015(22):200.

    [2] 黄艳丽,葛文谦.面向航天制造业数据挖掘的数据源框架研究[J].信息化研究,2018,44(5):6-10.

    【通联编辑:代影】