基于ITIL的电力信息自动化运维体系研究

戚伟强 沈潇军 洪建光 龚小刚 徐柳婧
摘 要: 随着电力系统规模的不断扩大,以及信息技术的不断普及,传统的电力运维系统已无法满足信息化电力系统的需求。ITIL技术框架日趋成熟,成为很多大型企业改善企业运维系统的主要方案,提高了企业业务的整体效益。提出一种基于ITIL的电力信息自动化运维体系,通过依托ITIL框架,修改其管理流程的具体实现以适应电力系统的特性,建立一套满足电力系统自动化运维的IT管理体系,以实现运维的高效率、高性能。
关键词: ITIL; 运维管理; 电力系统; 信息自动化
中图分类号: TN915?34 文献标识码: A 文章编号: 1004?373X(2017)03?0153?04
Research on electric power information automatic operation
and maintenance system based on ITIL
QI Weiqiang, SHEN Xiaojun, HONG Jianguang, GONG Xiaogang, XU Liujing
(Information Communication Branch Company, State Grid Zhejiang Electric Power Company, Hangzhou 310000, China)
Abstract: With the scale expansion of the electric power system and unceasing popularization of the information technology, the traditional electric power operation and maintenance system can′t meet the demand of the informatizationon electric power system. The increasingly?mature technology framework of the information technology infrastructure library (ITIL) makes massive large?scale enterprises perfect the operation and maintenance system, and improve the overall efficiency of the enterprise business. An electric power information automatic operation and maintenance system based on ITIL is proposed. The concrete realization of the system′s management process was modified by relying on the ITIL framework to adapt to the characteristics of electric power system. A set information technology (IT) management system meeting the electric power automatic operation and maintenance was set up to realize the high?efficiency and high?performance operation and maintenance.
Keywords: ITIL; operation and maintenance management; electric power system; information automation
0 引 言
国内电力系统的规模庞大,设备繁多且地理位置分散,导致运维管理复杂,往往需要大量的人员去运行维护,造成人力资源的浪费,而且管理数据信息无法共享,且易丢失,导致运维管理的费用很高,管理效率极低。目前很多大公司采用ITIL(Information Technology Infrastructure Library,信息技术基础架构库)技术实现公司的运维管理框架,基于ITIL基础框架规划,制定符合各公司特色的IT(Information Technology,信息技术,以下简称IT)基础架构及服务管理,结合IT管理技术和企业相关的业务信息来获取企业IT投资的最大化回报。本文提出一种基于ITIL的电力信息自动化运维体系,使用ITIL架构搭建电力信息自动化运维系统,实现运维效率与收益的最大化。
1 ITIL简介
ITIL是20世纪80年代末由英国政府部门CCTA(Central Computing and Telecommunications Agency)制订的适用于IT服务管理(IT Service Management,ITSM)的IT基础架构,目前在全世界的IT服务管理领域受到了广泛的关注和认可。通过结合IT技术和企业业务详情,为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范,从而使企业获取最大的经济收益。
ITIL架构库的六个模块[1]如图1所示,分别为业务管理、服务管理、ICT(Information Communication Technology,信息与通信技术)基础架构管理、IT服务管理规划与实施、应用管理和安全管理。其中服务管理模块由服务支持和服务提供两个流程组构成,分别掌控IT管理中不同的流程职能,这是ITIL架构库中最核心的部分,具体见图1,实现了IT服务最重要的管理功能。其中服务支持负责架构中运营级别的五个流程,分别为事故管理、问题管理、配置管理、变更管理和发布管理,实现运营过程中系统的运维管理;而服务提供负责架构中战术级的五个流程,分别为服务级别管理、IT服务财务管理、能力管理、IT服务持续性管理和可用性管理,通过这五个流程实现系统的合理化、可用性、可靠性、高效性、经济性、可扩展性与可维护性。
1.1 服务支持
在客户通过服务台提交故障信息后,系统进入事故管理流程,对上报的事件进行记录、归档和分类,并根据具体的事件安排相应的专家对事件进行处理,并对事故处理过程进行监督直至问题解决并终止,使系统尽可能少的对用户和业务产生影响,尽快恢复系统的业务级别。区别于事故管理追求系统的快速恢复,问题管理侧重事故根源的发现,以便从根本上解决问题以及预防问题的再次发生,通过对IT基础框架的调查和分析,查出其中的薄弱环节,找到问题发生的潜在因素,制定事故的解决方案以及预防措施来降低事故对业务的负面影响。确定了故障解决方案后,需要实现系统的配置管理,通过对系统配置项的识别和记录,确定系统的配置项状态,业务实行过程中需要记录、报告系统配置项的状态和变更请求,以便检验配置项改变过程的正确性和完整性,为IT基础架构提供逻辑模型支持,并支持其他管理流程的运行,尤其是变更管理和发布管理的操作。变更操作是指使用最短的中断时间完成基础架构或服务需要的变更需求并进行相应的控制,确保使用标准的方法和步骤在最短的时间内完成系统变更的实施过程,确保变更造成的业务中断对系统产生的负面影响最低。在经过各方面的测试之后,需要发布管理,将测试合格的新配置项修改方案发布并导入到实际的应用中,其受控于变更管理流程。
1.2 服务提供
服务提供是战术级的流程,通过各种战术策略的制定,使得IT管理服务达到最大的收益,在服务级别管理中,为了签订服务级别协议(Service Level Agreements,SLAs),需要提出系统级别划分的计划方案、草拟出计划方案详情、通过团队协商确定一个或几个分级方案、通过对各方案的监控和报告以及相关协议签订后服务绩效的评价来确定最终合理的服务级别协议,该流程主要是为了确保组织所需的IT服务质量和成本正相关,在成本合理的情况下,保证服务质量稳步提升。系统必须保证在成本和业务的双重需求下,发挥IT资源最大的效能,即实现能力管理,通过对服务能力的合理配置,实现服务资源的最优化分配,其包含了对业务能力的管理、服务能力的管理和资源能力的管理三个子流程,通过对三个子流程的统筹管理实现最优化的能力管理。为了保证结构的可用性,服务提供中设计了可用性管理,通过对用户和业务可用性需求的分析优化并设计IT基础架构的可用性,在满足不断增长的可用性需求的同时确保成本的合理性,通过对业务和用户可用性需求的定位,在真实需求的基础上建立IT服务的设计,从而避免采用过度的可用性级别,节约整体服务的运作成本。
2 基于ITIL的电力信息自动化运维体系
2.1 电力运维服务
ITIL服务管理是面向服务的管理系统,所以在实现基于ITIL的运维系统前,必须明确电力信息运维系统提供的服务,面向的运维对象,具体的服务产品、基础设施与服务职员等信息[2]。
电力运维系统提供的主要服务有调度、运行、检修和客户服务。遵照统一调度、分级管理的方式,电力信息调度需要负责全省信息系统的调度指挥管理、运行方式编制和修订、信息系统调度管理、调度运行工作规范化以及标准化建设。电力运行的运维需负责信息系统运行的技术管理、信息安全管理、信息系统运行监控、缺陷管理、运行分析等工作。信息检修的运维包含计划检修、临时检修和紧急抢修等檢修工作的管理、检修工作计划的编制和执行、设备维护及其保管、备品备件管理、信息化项目建设的配合、验收测试等。客户服务负责服务台的建设与管理、客户服务请求的受理和进度跟踪、服务质量管理、客户服务工作的统计分析、业务系统相关的信息发布,还需提供综合管理,负责信息系统的资产管理、报表管理等综合管理、信息系统调度、运行、检修、客服工作的考核评价管理。
不同的运维服务面对不同的运维对象,调度的运维对象是整个电力信息系统,以及制定调度策略和编制运行方式的人员等;运行的运维对象包含电力系统基层设备、监控设备以及进行监测的人员与分析人员等;信息检修面向电力设备、检修设备、检修人员、设备维护人员等;客户服务的对象是客户,需要接收客户的请求,受理请求、进度追踪和服务质量管理等;综合管理需要管理系统中各个模块的报表、资产,进行人员考核与评价管理等。
要实现电力信息自动化运维,需要实现以下六大功能:资源交付部署、资源动态分配、配置同步设定、系统设备巡检、故障诊断处理、统一规划知识库。资源交付部署中需要完成资源申请、资源分配、软件部署、资源创建等功能;在资源动态分配中需要实现资源监控、主动发现、网络管理、资源调配等功能;对于配置同步设定需要实现信息采集、信息管理、授权控制、配置变更等;系统设备巡检中包括告警策略、周期采集、规范约束等;故障诊断处理包含故障分析、故障预警、智能故障排除、报表管理等;统一规则知识库中有规则制定、规则审核、规则管理、规则匹配等功能。
2.2 电力自动化运维流程
ITIL框架是以流程为向导的,需要将运维功能流程化,根据ITIL服务管理中服务支持和服务交付的10个流程,设计电力自动化运维的对应管理流程,如图2所示。
在服务支持中的管理流程有服务台、事故管理、问题管理、配置管理、变更管理、发布管理、知识管理[3]。
服务台:建立全局的电网服务平台,搭建数据中心、服务器、建立服务网站平台,根据不同的用户设置不同服务级别的权限,分别有管理人员、维护人员、客户等人员权限,网站服务平台提供统一的接入口,但针对不同级别的用户,提供不同的系统功能,维护系统的稳定性。同时,在线下建立服务平台,连接客户、维护人员和管理人员,帮助客户解决客户自己解决不了的问题。
事故管理:在网站服务平台中,提供客户事故保修功能,自我检查事故信息功能,以及一些常见的事故检修经验,对于难度大的事故,会有专家现场指导,稍小点的事故,二线维修人员可通过网上的事故维修教程学习并进行修复,也可直接进行远程控制指导。
配置管理:在数据中心建立配置资源数据库,管理所有的配置信息,识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,对系统运行进行监控,实现信息采集、信息管理、授权控制、配置变更等。
变更管理:通过数据中心模拟全局的资源分配情况,辅助管理人员进行决策。减少设备变更对系统整体性能的影响。
发布管理:根据资源分配策略完成设备状态的变更来实现资源分配,根据变更管理的流程控制发布的信息,完成系统的变更操作。
知识管理:对系统中产生的数据进行分类、存储、检索与匹配,产生智能处理办法,智能化处理重复性事件,减少冗余的操作。
在服务交付中,需要实现服务级别管理、可用性管理、服务持续性管理、服务能力管理、财务管理以及服务水平管理。具体如下所示:
服务级别管理:运维系统根据运维对象的不同、管理级别的不同,对不同的用户设置不同的使用权限,并针对不同用户实现不同的系统功能,同时在系统后端完成数据的汇总、分析、处理、存储。
可用性管理:根据用户和需求方的可用性需求分析,分析系统的优缺点,完善系统,或更换系统,采用PDCA(Plan(计划)、Do(执行)、Check(检查)、Action(行动))循环管理对运维系统进行全面质量管理。
IT服务持续性管理:设置备份方案,在系统发生灾难时及时调动备份资源,完成系统的修复,从而支撑系统的快速恢复。系统需要统计各地资源,掌握各地电力资源的实时状态,并通过全局的管理系统获取调度方案,通过动态的资源调配并给相应人员下发指令,完成系统的快速恢复,以支持IT服务的持续性管理。
IT服务财务管理:对每一笔基础设施的支出与收入、运维服务的成本、维修费用、客户上缴费用、投资费用、风险费用、运维人员的工资等各类费用进行分类存储,通过系统的数据中心完成财务统计,进行预算和核算,通过量化服务成本减少成本超值的风险和浪费,保证电力系统运维的成本效益。
能力管理:通过数据中心完成成本预估和业务需求分析,对服务能力进行评估,通过对比资源的使用情况,找到合理的资源分配方案以及服务提供方案,根据各地区的使用特点提供具体的服务资源,使IT资源发挥最大效能的管理流程。
服务水平:系统中提供一个统一的评分标准,对客户评价、考核评价进行综合考虑,评估每个运维人员的服务能力,选择性地进行培训,提拔有经验的运维人员来提高系统整体的服务水平。
对于ITIL的其他模块,业务管理、ICT基础架构管理、IT服务管理规划与实施、应用管理、安全管理,在电力系统设有专门的模块进行维护和管理,分别建立数据库,存储管理数据以及相应的评分系统完成管理系统的评判与优化,通过数据中心进行数据共享完成系统的统一管理。
2.3 系统框架設计
基于ITIL的电力信息自动化运维体系,首先需要建立一个统一的数据平台即电力数据中心,以及一个统一的操作平台服务器,需要存储设备信息、资源信息、运行产生的数据、业务数据、服务数据、财务数据、人员数据等数据信息。
系统的框架图如图3所示。
3 结 语
本文介绍了ITIL框架的架构和现有电力运维体系的基本现状,提出一种基于ITIL的电力信息自动化运维体系,根据电力系统的实际情况对ITIL框架进行相应调整,使其更加满足电力系统的特性,以实现一个高性能、高效率的自动化电力运维系统。在该体系中实现了故障处理、业务受理、变更操作、日常维护及巡检等一系列的运维工作,能够对基础设备进行在线监控,提供与客户交互式的服务,根据电力业务的实际情况,实现了最优化的业务管理,通过安全管理保证了系统的可靠性与安全性。
参考文献
[1] 杜志强.ITIL在电力企业信息系统运维管理的应用研究[D].北京:华北电力大学,2014.
[2] 吴博.ITIL应用浅析[J].计算机光盘软件与应用,2013(6):175?176.
[3] 李荣华.基于ITIL的IT运维管理系统的设计与实现[D].北京:北京邮电大学,2010.
[4] 孙强,左天祖,刘伟.IT服务管理:概念理解与实施[M].北京:机械工业出版社,2003:7?18.
[5] 彭海,李晓娥.基于ITIL的IT服务管理实践[J].电力信息化,2009(7):89?93.
[6] 智海燕,秦龙,王宇,等.基于EA的电力企业信息资源整合服务设计[J].现代电子技术,2016,39(9):138?142.
[7] 李金灿,陈皓勇.关于电力系统远程监控优化配置设计[J].计算机仿真,2016,33(3):389?394.
[8] 米晓萍,李雪梅,贾春花.电力系统故障节点快速定位算法研究[J].计算机仿真,2016,33(1):112?115.
[9] 高鹏,李尼格,范杰.电力系统信息通信网络安全及防护研究 [J].现代电子技术,2014,37(18):146?148.