社保大数据平台建设

    张成银

    The Construction of Social Insurance Big Data Platform

    ZHANG Cheng-yin

    (Zibo Social Insurance Affairs Center, Zibo 255000, China)

    【摘? 要】随着大数据技术的不断发展,在大数据时代背景下,社会保障的信息化程度不断提高,但其中仍存在一定问题。为进一步提高数据分析、整理、加工以及利用的能力,就要进一步对社保数据实行云化管理。论文对社保大数据平台的建设进行具体分析,以供参考。

    【Abstract】With the continuous development of big data technology, under the background of big data era, the informatization degree of social security is constantly improving, but there are still some existing problems. In order to further improve the abilities of data analysis, collation, processing and utilization, it is necessary to further implement cloud management of social insurance data. The paper provides a specific analysis of the construction of social insurance big data platform, for reference.

    【关键词】社保;大数据平台;建设

    【Keywords】social insurance; big data platform; construction

    【中图分类号】F842.6;TP311.5? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文献标志码】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編号】1673-1069(2021)05-0148-02

    1 引言

    现阶段,对于我国社会保险领域的工作来说,依然存在数据分散的问题,而且数据信息难以实现有效共享,没有较高的利用率。因此,通过集中和整合各项数据,构建一个统一的大数据平台,通过平台实现信息的共享和集成,能够对于各项业务作出具体的分析和预测,并为各项决策提供数据支持和保障,进一步提高数据共享能力。

    2 大数据技术在社保工作中应用的重要意义

    2.1 解决社保认证难的问题

    近年来,我国的社会保险在不断地扩大覆盖面,这就导致常常会出现在参保人员死亡后,依然享受社保待遇的情况,特别是对于一些偏远的农村地区来说,这一现象更为频繁。通过大数据平台的建立,能够进一步与公安和民政部门合作,汇集三方力量,共同确立信息共享的长效机制,能够对参保人员是否应该享受社保待遇进行有效的认证。公安和民政部门向社保部门提供参保人员的信息,让其能够核对参保人员的死亡情况以及户口注销的信息,通过核查比对,之后再将名单向当地的社保中心进行通报,通过实地核查之后,如果确定发生骗保行为,则首先要停止对其提供社保待遇,之后要将非法所得进行追回处理。

    2.2 提高数据分析的精准度

    对于我国的社保工作来说,经过长期的发展已经确立起基本的工作制度和框架,并且随着社会的进步,社保的数据信息量也越来越庞大,因此,迫切需要在社会范围内,实现社保信息资源的共享。在大数据技术的应用之下,推动了社保工作水平和效率的不断提高,同时,能够对于一些社会趋势以及矛盾问题进行更加精确的分析和处理,并且探索出了全新的工作思路和途径。对于一些社会保障的管理难题,实现了有效的解决,具有较高的前瞻性,而且还能够促进政府与百姓之间的密切联系,让政府具有更高的科学知晓度。

    3 现阶段社保数据存在的问题

    3.1 对社保数据的价值缺乏认识

    对于一部分地区来说,没有实现对社保数据价值的充分挖掘,甚至会出现一些工作误区。在社保工作中应用大数据,有助于决策管理的顺利进行,而对于大数据进行分析,能够预防各类风险问题的发生。现阶段,很多地区的社保工作都没有认识到数据的重要价值,对于社保数据积累和分类工作重视力度不足,对于一些重要信息,仅仅进行单纯的记录和储存,没有进一步实现详细的分析,无法为日后的社保工作提供实践性的指导。

    3.2 社保数据的专业分析能力较低

    现阶段,对于社保数据的分析方法来说,分析手段较为有限,而且专业性较低,无法对于数据价值实现充分的挖掘和利用。对于一些地区的社保工作来说,其对于一些较为复杂多样的数据,没有作出专业性的分析和处理,往往都是简单地对其进行整理和汇总,甚至很多时候对于这些大体量的数据选择忽视。

    3.3 社保数据的安全管理水平不高

    社保数据不仅与政府运行以及企业的竞争有着很大的关系,而且还关乎个人隐私问题,涉及众多方面的利益,而且覆盖面广,具有显著的重要意义。现阶段,很多社保机构没有确立一个完善的信息安全制度,而且相关工作人员对于数据信息没有较强的安全意识,因此,隐私泄露的问题常常发生。

    4 社保大数据平台的建设

    4.1 顶层设计

    在顶层设计中,分为云结构、积木式架构、容器技术以及多级权限设计四方面的内容,这样就能够通过顶层设计,集成应用与服务,让数据具有更高的集中性。首先,从社保大数据平台的整体架构来看,通过云结构设计,能够在云端实现数据资源的集中,同时,能够通过“多屏合一”进行数据的访问。其次,利用积木式架构设计,能够对于各个粒度实现有效调用。提供数据调用以及基础调用功能,还能够进一步对于调用组合实现更加成熟的应用,这样就能够让社保大数据平台提供自主需取的服务。再次,通过容器技术,能够让所提供的平台、接口、标准具有更高的开放性,还能够有利于实现社保内部系统之间的集成和整合,而且也能够在社保业务系统中实现第三方资源和系统的有效接入,让各个部门之间实现数据的互通和共享。最后,利用多级权限设计,能够确立一个社保数据的管理清单,之后通过一致的认证接口,确保政府的相关管理部门和各个服务机构能够提高系统接入的安全性,扫清访问途中的障碍,扩大政务系统访问业务的范围。通过对基础的支撑层的着重开发和建设,能够让社保的业务数据集中起来,实现社保大数据平台的有机构建,提高数据的统一性和共享性,实现线上和线下平台的互通和融合,提供更加优质的智慧社保服务。

    4.2 平台架构及关键技术

    4.2.1 数据交换平台

    数据交换平台由三部分组成,分别为加载服务器、FTP服务器、NAS集群。通过这三部分共同实现对于数据的获取加载以及归档任务。首先,对于FTP服务器来说,通过LVS进行FTP集群的构建,在云数据推送平台对于数据处理之后,进行数据的接收,并且对于数据进行存储,让其能够在NAS集群的目录中;其次,加载服务器能够对于ETL任务实现有效部署,并且对文件进行归档操作,让其能够到达历史数据区;再次,在日期和源数据系统的基础上,进行目录的划分,并且缓存数据,为日常的数据操作以及ETL任务提供有效的支持;最后,云数据推送平台能够获取源系统中的数据,并且按照需求进行分发。利用OCG技术将数据在MySQL集群中进行存储,并且能够在该项接口技术的基础上,对于不同接口定义的源数据表,进行一个独立文件的生成,之后再进行LZO数据压缩,利用FTP进行接口文件的存儲,将其放置在NAS指定目录中。对于部署在不同的服务器上的数据交换组件来实现社保数据的交换工作,利用NAS指定目录,能够对于接口实现有效获取,并开展文件级的检核,在检核通过之后,对于数据以及控制文件进行转移,让其能够到达NAS集群的指定目录当中,进一步引发之后的ETL处理,在调度之下进行数据的加载和归档。对于数据交换平台来说,其构成有两部分内容,分别为X86服务器以及NAS集群。X86服务器能够根据不同的功能,进行两个组别的划分,分别为LVS服务器以及加载服务器,LVS服务器执行数据的获取工作,而加载服务器则对于数据实现加载和归档任务。对于NAS集群来说,其属于一种公共的数据区,各个服务器都具有访问的权限,能够实现数据的共享。数据交换平台一般只有一个NAS集群,同时,还具有若干台X86服务器。

    4.2.2 基础计算平台

    通过对于Hadoop集群的建构,能够在业务条线以及元数据模型的基础上,对于社保业务系统中的数据明细进行存储。

    4.2.3 流程调度平台

    对于流程调度引擎的开发,能够让数据平台的任务更加高效地运转和调度。通过Task Automation对于各个平台进行驱动,这样就能够完成数据的存储、数据集市的生成和得到完整的处理流程,并实现该过程中工作流的有效管理。而对于数据交换平台来说,要对于数据进行抽取以及文件及质量的核检,同时,还能够对于加载数据实现有效的调用。而对于基础计算平台来说,利用Hive SQL进一步让贴源数据实现高度整合,还能够对于数据进行有效的处理和汇总。而对于管理分析平台来说,通过关系型数据库中的SQL,进一步对数据进行处理和分析。历史归档查询平台则要落实好数据的归档工作。流程调度需要依靠调度引擎来实现,并且在MySQL数据库中,进行任务定义和数据的进一步存储。

    流程调度平台的主要构成内容是X86服务器,而且对于其中的服务器来说,也能够根据功能进行两种类别的划分,分别为对于流程调度源数据的存储、对于流程调度引擎的部署,执行对于不同数据区的内部数据所开展的处理流程的调度和运行任务。

    4.2.4 管理分析平台

    管理分析平台由三部分构成,分别为BI软件、X86分析型数据库集群、J2EE应用,能够应用于社保数据的管理、分析、加工任务。

    4.2.5 实时分析平台

    实时分析平台是一个集群,其内部的组成为高档X86服务器,不仅能够具有较高的实效和并发,还能够满足实时管理分析的基本需求。

    5 结语

    综上所述,社保大数据平台的建设能够在社保工作中充分利用大数据技术,将其优势发挥出来,实现社保数据的集中,并且集成数据应用与服务,进一步提高社保工作和服务的质量和效率,推动社保信息实现共享和协同。

    【参考文献】

    【1】.大数据中的“社保”世界——全国电子社保卡突破3亿张[J].中国人力资源社会保障,2020(12):2.

    【2】提升民生社保大数据审计能力 更加关注保障和改善民生短板[J].现代审计与会计,2020(10):1.

    【3】严玉兔.“线上社保”的机遇、挑战与治理效能——以浙江省为例[J].中国社会保障,2020(9):48-49.