大数据时代高校电子档案管理创新研究

    李爱华

    摘? 要:大数据时代已经到了,正在影响各个行业,档案也不例外,高校档案如何在大数据时代进行管理创新,将档案中蕴含的数据价值凸显出来,助力高校各项工作的开展成为高校档案人面临的挑战。

    关键词:大数据;档案管理;数据挖掘

    高校档案是高校在日常管理、招生教学、基础建设、科学研究等活动中直接形成的对社会、学校和学生具有保存价值的历史记录;是对高校办学历史、办学经验、办学成果全面真实的记录;是反映高校党政管理、培养人才、科学研究、服务社会、对外交流等各项工作的综合记录,从时间维度看,具有非常大的数据价值。

    大数据时代,伴随着高校智慧校园建设不断推进,高校档案的利用服务需求日益增长、利用方式日趋丰富,原有的管理模式已经不能满足需求,迫切需要转变管理机制、创新管理模式,将高校档案中蕴含的数据价值凸显出来,服务支撑高校各项事业的发展。

    1 高校档案电子化管理是必然性

    1.1 档案信息化是大势所趋。近年来,网络信息技术高速发展,我国档案信息化的进程也不断加快。据经济日报报道,中国第一历史档案馆、中国第二历史档案馆数字化工作成效显著,各级档案馆数字档案资源的比例均有大幅提高,全国数字化档案资源达2243万GB。[1]

    此次新的档案法修订草案新增“档案信息化建设”一章,其中第28条规定,各级人民政府应当将档案信息化纳入信息化发展规划,保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存和有效利用。同时,修订草案第30条还明确,电子档案应当符合来源可靠、程序规范、要素合规的要求,不得仅因为电子档案采用电子形式而否认其法律效力。具有法律效力的电子档案可以以电子形式作为凭证使用。

    1.2 高校各项工作要求驱使。目前,教育部对高校实行“五年一轮”的普通高等学校教学工作水平评估制度。在教育部对高校的评估指标体系中,每个评估点都与档案密切相关,都需要规范完整的档案材料支撑,在教学评估中,档案发挥了极其重要的作用。

    近年来,党中央高度重视巡视巡察工作,纪委监察部门对高校的巡视巡察工作已经成为常态。在每次的巡视巡察中巡视组都需要查阅大量的档案资料,比如党政管理的文书档案、干部职工人事档案、财务会计档案等。

    校史展览、学历认证、教育部教学评估、纪委监察部门的巡视巡察等对档案工作提出了高的要求,要求各类档案收集全面、整理规范、查询利用方便快捷,给传统的档案工作机制带来挑战,迫使檔案部门要将档案进行数字化来适应高校各项工作开展要求。

    1.3 智慧校园建设推动。进入21世纪以来,特别是近几年,信息技术迅速发展,各种技术应用层出不穷;教育信息化、智慧化建设正如火如荼进行,教育部《2018年教育信息化和网络安全工作要点》中明确指出要设立“智慧教育示范区”、引导各级学校开展数字校园和智慧校园建设与应用。河南广播电视大学也在积极开展智慧校园建设与应用探索,档案信息化建设作为智慧校园建设的一部分,得到前所未有的重视。借助智慧校园信息化建设,电子档案管理机制有了技术保障。

    1.4 各项关键技术的成熟应用。目前包括光学字符识别技术、自然语言处理、数据挖掘与分析技术等各项关键技术已经成熟。

    高校的档案数字化工作利用OCR识别系统,可以将纸质档案扫描后的图像档案进行一个转换,使图像档案内的图片继续保存,有表格,则表格内资料及图像内的文字,一律变成计算机文字,识别出的文字可再使用及分析形成可编辑的电子文档格式,减少因键盘输入花费的人力与时间,从而提高工作效率。

    自然语言指的是日常使用的语言,如汉语、英语和日语等。而自然语言处理(Natural Language Processing,NLP)则是指运用计算机技术对自然语言进行处理、理解并运用,它是人工智能和语言学的分支学科。作为人工智能领域研究的重要方向之一,自然语言处理的主要目的是通过自然语言的形式实现人和计算机之间的交互。将NLP技术应用到高校电子档案的管理之中,将会极大地提升档案查询利用的效率和效果。

    大数据挖掘技术的基础应用功能是挖掘与分析数据信息。高校档案信息的来源渠道非常丰富,门禁、监控、食堂以及图书馆等都是信息来源;数据内容十分冗杂繁复,比如学生学籍信息、教务信息、网络浏览信息、校园采购、多媒体教室使用、校园出入以及实时监控等。大数据挖掘技术可以从上述数据信息中挖掘出关联性较强的数据,将其分别转化成独特编码,联系大的信息规整为一类,例如某同学的校园出入记录、食堂用餐消费、图书馆借阅信息等,便于校园管理者查询,可以有效降低学校工作者和智慧系统的负担。

    利用大数据挖掘技术可以对档案中的价值数据进行挖掘,助力高校各项业务工作的开展,为校领导的有关决策提供数据支撑。

    2 高校电子档案管理创新

    2.1 纸质档案数字化及电子文件归档。高校的档案数字化工作的重点通常是纸质档案的数字化工作,由纸质档案而转换形成的各种格式的电子文档也成为数量最多、内容最广泛、最为重要的数字档案资源。一般高校纸质档案的数字化工作分为几个步骤:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接。很多高校的档案管理部门通过以上六个步骤基本实现了纸质档案的数字化,建立起了数字档案目录数据库,由于与数字档案目录数据库相关联的数据格式为图片格式,所以有的高校除了提供数字档案目录查询的功能外,又提供了缩略图查询功能。

    可以将高校档案管理系统与高校办公自动化系统及其他业务系统如教务管理系统等进行对接,在线实时进行电子文件的归档工作,既提升了档案收集的效率,同时也降低了档案数字化的工作量。

    2.2 档案数据化及数据清洗。在高校档案管理工作中,需要以大数据为抓手,使传统意义上的人工化、扁平化的管理模式有效改变,确保档案管理工作从“数字化”向“数据化”的转化。

    在实际的档案管理过程中,需要把僵化死板的档案扫描全文和目录,转变成活灵活现的大数据档案,从根本上实现档案的数据化管理。[2]针对档案全文的著录,要有效进行数据化加工,针对文本和图像中的数字内容要进行数据化的识别、分类、著录和标引,通过这样的方法,才能真正意义上提供更优质的档案信息服务,使高校更好地利用检索词检索到与之相对应的档案信息内容。

    高校在前期信息化建设中,搭建了数字化校园基础平台,完成了部分资源的共享互联工作。随着业务部门应用系统的增加,以及对信息化需求的不断扩张,大量教学、科研、人事、行政、后勤管理等方面的业务数据资源日益积累下来。在保证学校原有IT资源的前提下,高校需要对这些资源进行充分合理的利用,通过数据清洗的手段,采用全面有效的、权威准确的信息数据,形成服务资源,分类型存储在数据库中,并对这些数据进行挖掘和分析,为高校档案管理提供数据支持。

    2.3 档案数据挖掘与分析。数据挖掘分析在高校档案管理中,主要应用于档案分类、档案收集、档案保留,以及为档案部门提供服务。高校档案数据的挖掘与分析不仅可以提高高校档案管理的效率、增强档案管理的安全性、推動高校档案管理体系的完善,还有利于提高高校档案信息知识转化能力、档案信息知识服务水平,推动智慧校园信息资源建设等。

    2.4 数据分析展现,为决策提供支撑服务。在大数据时代,高校比以往任何时候都面临着更为复杂的生存环境,高校档案数据分析可以对建校以来的数据进行挖掘分析,为高校的各项业务开展提供业务决策支撑。[3]可视化的数据分析展现结果可以很清晰地为决策提供服务支撑。

    3 小结

    在大数据时代,变化是不变的趋势,创新档案管理机制,以档案信息化建设为依托,转变服务理念,从传统的馆藏中心模式向服务中心模式转变向业务决策支撑转变,变“被动”为“主动”,紧密结合学校各项实际应用需求提供数据支撑服务,提升档案工作在高校各项工作中的重要性,充分发挥档案的数据价值,更好地服务于高校的各项工作开展。

    参考文献:

    [1]牛力.数字时代档案创新开发利用的几点思考[C].中国档案学会、中国文献影像技术协会.2019年海峡两岸档案暨缩微学术交流会论文集.中国档案学会、中国文献影像技术协会:中国档案学会,2019:53-57.

    [2]刘永,庞宇飞.档案数据化之原生数据源全链式管理分析[J].档案管理,2018(05):11-18.

    [3]赵旭,辛玉明.大数据背景下高校档案信息化管理探析[J].兰台内外,2017(4).

    (作者单位:河南广播电视大学?? 来稿日期:2019-11-18)