首页 > 范文大全 > 正文

浅谈如何在企业实现IT运维作业规范化

开篇:润墨网以专业的文秘视角,为您筛选了一篇浅谈如何在企业实现IT运维作业规范化范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:随着社会信息化的深入普及,信息化技术在企业的生产制造、经营管理和社会服务等领域发挥着越来越重要的作用,企业员工的日常工作也越来越离不开信息化技术的支持。这将势必导致企业对IT运维需求的与日俱增,IT运维作业的工作量也日益繁重。文章以一个能源企业为例,分析该企业目前IT运维的整体现状,并在信息技术基础构建库(ITIL)理论基础上,探讨如何在企业实现IT运维作业规范化,降低IT运维成本,提升IT运维水平。

关键词:能源企业;IT运维,IT作业;规范化

中图分类号:TP315 文献标识码:A 文章编号:1006-8937(2013)12-0062-03

1 背景与现状

近几年,能源企业信息化技术发展迅猛,企业对信息系统运维人员的需求也越来越多,这对运维水平也提出了更高的要求。在此背景下,并随着ITIL理念引入到国内,全国各大能源企业逐步开始在企业内部推广实施IT服务管理(ITSM),意在吸收和利用ITIL最佳实践来指导企业开展IT运维和IT服务工作。经过近几年努力,很多企业都建设了ITSM管理信息系统,成立各自的一、二、三线IT运维队伍、制定符合ITIL标准的IT事件管理、变更管理、问题管理和管理等运维流程,整个IT运维管理、服务模式相比较过“灭火队”式的IT运维有了翻天覆地的变化。

但笔者作为一名就职于能源企业的IT运维工作人员,在感受到IT运维更规范、服务更便捷的同时,也注意到企业的IT运维依然存在很多不足之处,特别是在IT运维规范化作业方面还有很大的空间。例如按照ITSM事件管理流程,一名IT运维人员从ITSM系统中接到某用户电脑故障IT事件单后,则预约用户按时到现场为用户进行维修。运维人员根据工单对故障描述和对用户的简单咨询,基本上就可以确定设备故障点,并可通过现场维护或设备送修方式处理故障,等处理完成后由用户确认,并通过ITSM系统回填工单完成情况,至此基本上可结束此次IT事件的处理。但进一步深入分析,以下还有几个值得去思考的问题:IT运维人员上门开始维护前,是否需检查设备资产登记的准确性;如不准确或该设备不属于企业资产是否还应继续提供维护服务;如设备维护过程中,需要更换故障硬件设备,那这些更换硬件设备该如何申请;更换完成后设备资产发生改变了又如何能做到及时在系统登记更新。诸如此类的细节问题在ITIL中并没有给出答案。

解决以上问题,有的企业可能会出台相关运维制度细则,又或者随着运维经验的积累已形成了一套行之有效的做法等,但在执行过程中,往往又会发现缺乏操作规范、各人员作业标准步骤不一致等问题。笔者认为要彻底解决这些问题,光靠制度、运维经验、人员责任心是远远不够的,还应该把这些制度更细致地进行梳理,也就是管理要制度化、制度要流程化、流程要表单化。

2 IT运维作业规范化思路

那到底如何才能使流程表单化,笔者认为可以通过IT运维作业规范化来实现。也就是IT运维人员在做每一项IT运维作业时,要清楚每一项这个作业从开始到结束要完成那些步骤,每一步骤要执行什么样的标准、涉及的IT资产有哪些、需要获得那些外部资源、如何去完成这些作业步骤、以及作业完成输出结果是什么等,最后把以上每一项作业步骤都用统一运维表单来进行固化,并把整个运维过程编制成标准化、规范化的IT运维作业指导书。

因此,既然企业需要实现IT运维作业规范化,那第二步就要梳理出企业究竟有多少种IT运维作业,作业对象有哪些,这也是编制规范化作业指导书的前提。通过调查发现,能源企业的IT运维作业对象种类繁多,例如服务器、存储资源,网络安全设备、主营业务系统、数据库平台软件,甚至还包括桌面终端PC、移动PDA等。再进一步深入分析,这些种类繁多的IT作业对象其实就是企业的IT资产,如果采用资产全生命周期管理的概念并结合IT运维管理去理解,IT运维作业规范化可归类为:资产上线阶段的运维作业规范化,资产运行过程阶段的运维作业规范化,资产下线阶段的运维作业规范化做这三个阶段。

3 IT运维作业指导书梳理和编制

一个企业所有的IT资产的投入使用,最终目的都是为信息系统的运行而服务的。因此,这里笔者以一个信息系统从上线投运,到推广运行,再到下线退运作为举例,介绍在这三大运维阶段,到底需要编制哪些规范化的IT运维作业指导书。

3.1 资产上线阶段的运维作业指导书

一个应用系统上线肯定要有一个实施方案,方案有简单有复杂,但里面的内容一定会有该系统对软硬件资产的需求说明,例如需要几台服务器、数据库表空间和存储空间多大、需要开放哪些防火墙端口等。而恰恰就是这些需要申请的软硬件资产界定了运维人员在该系统的三大运维阶段,需要运维的对象和内容。

如果系统上线需要服务器设备,则上线运维内容应包括设备登记出库、设备在机柜安装上架这两个设备物理安装环节,完成设备上架后根据实际需求还可进行操作系统的安装设置、数据库和中间件安装配置、存储资源分配等作业内容。最后当系统后台软硬件都完成安装配置之后,则进入应用系统的上线安装调试环节。而这部分内容又包括系统软硬件上线前安全测评和整改,系统上线加入监控等。每个环节涉及的IT资产都可以编制相对应的运维作业指导书(图1),例如:《设备出库作业指导书》、《设备上架安装作业指导书》、《操作系统安装作业指导书》、《存储资源配置作业指导书》和《应用系统作业指导书》等等,作业指导书的分类细致颗粒度,可根据企业的实际情况而有所选择。编制这些作业指导书,一个重要目的就是要让运维人员清楚哪些作业需要自己来参与,需要通知谁来配合完成,哪怕是一个新上岗的运维人员,经过简单培训,其只要按照标准、规范化的运维作业指导书一步步来进行操作,也能够顺利完成一项复杂的信息运维作业。

3.2 资产运行过程阶段作业指导书

应用系统完成上线后,则进入前面所说的“资产运行过程阶段的运维”。只是运维作业不再是设备安装,而是根据实际需求,对已投运的设备进行配置变更管理、故障处理和巡检。例如,服务器内存增加、电源故障处理,运行状态巡检。又例如,交换机VLAN修改,防火墙端口开放,运维审计系统增加用户权限等等。这一阶段的运维作业工作量相比起其他两个阶段,可以说是作业内容最多、最复杂和最繁重的。运维人员可根据实际情况,把每一项作业选择在ITSM的事件管理、变更管理、问题管理、管理或计划任务管理流程来处理。但要记住,只要设备资产的配置项发生改变,都应及时在ITSM系统中进行登记,确保设备资产登记的准确性,这也是编制规范化的运维作业指导书的重要原因之一,提醒和规范运维人员的每一项作业,都不能遗漏的步骤。

本阶段的运维作业归纳起来可以合并成三部分:设备配置修改变更运维作业,设备故障处理运维作业,设备运行状态巡检运维作业,相对应的运维作业指导书也是这三部分,只是作业对象、资产类别不同而已(图2)。不过我们要注意的是,这一阶段的运维作业指导书很可能存在相互复杂的交叉、套嵌和引用的情况。例如,系统维护员A正在对某系统进行巡检作业(使用《XX系统巡检作业指导书》),作业中发现系统无法使用,并判断原因为系统服务器故障,则A应立即通知服务器维护人员B处理故障。B接到通知后,启动服务器故障处理作业(使用《服务器故障处理作业指导书》)。B发现是服务器的硬盘坏了,需要更换硬盘,并且更换后要重新调整磁盘RAID配置,因此又需要进行服务配置变更维护作业(使用《服务器变更维护作业指导书》)。处理故障完成后,B认为该台服务器之前没有加入监控导致不能及时发现故障,应该加强对服务器的监控。因此这个时候B又需要通知监控人员C进行设备监控作业(使用《设备监控作业指导书》)。从这个例子我们可以看到,从A进行巡检、到B进行故障处理和配置变更、再到C增加设备监控,1个巡检作业虽然看似简单,但背后很可能关联着多个运维作业内容、需要多名运维人员使用多份不同的运维作业指导书进行运维作业。这就要求我们不能简单、孤立的去看待每一个运维作业,应该从整体出发,不单要规范每一个作业的操作内容,还应关注各运维作业的相互关系。

3.3 资产下线阶段作业指导书

当信息系统需要下线、退出运行时,运维人员需要考虑的运维对象不单仅仅是应用系统本身,还应包括与其相关配套的软硬件资源。例如应用系统所属的服务器设备下架回库、应用系统数据删除、IP地址回收、取消系统监控等,需要编制的作业指导书也是这些内容(图3)。

4 结 语

本文主要就一个应用系统从上线投运,到推广运行,再到下线退运这三个运维阶段,所涉及的作业对象、作业内容、需要编制的运维作业指导书进行了梳理。就如前文所说,IT运维对象范围广、内容多、作业存在交叉点又特别普遍,本文也只是提供一个从设备资产全生命周期管理的角度,来思考如何帮助企业编制IT运维作业指导书、实现运维规范化。对于如何编写规范化格式的IT运维作业指导书,如何利用ITSM系统来固化作业流程、作业表单等问题,因文章篇幅有限,无法在此继续深入进行详细讨论。但笔者相信IT运维作业规范化,是企业提高IT运维技能、提升服务水平、实现企业信息精益化管理的必由之路,规范化的IT运维作业为企业的信息化深入普及和更高层次的应用保驾护航。

参考文献:

[1] 刘通.ITIL V3服务管理与认证考试详解(第3版)[M].哈尔滨:哈尔滨工业大学出版社,2012.

[2] 博恩(荷).章斌(译).T服务管理:基于ITIL的全球最佳实践[M].北京:清华大学出版社,2006.

[4] 刘小茵.基于ISO\IEC20000的IT服务管理体系实施指南[M].北京:中国标准出版社,2010.