首页 > 范文大全 > 正文

浅论民航管制综合信息系统的运维管理

开篇:润墨网以专业的文秘视角,为您筛选了一篇浅论民航管制综合信息系统的运维管理范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

随着民航事业的飞速发展,民航空管系统通过引进新技术,改进管制流程,不断地提高空管保障能力,以满足日益增长的航班量需求。例如航班信息处理系统(FIPS,Flight Information Process System),塔台运行管理系统(TOMS,Tower Operation Management System)、中南地区航班协同放行系统(包括多机场统一放行子系统、机场放行排序子系统、协同决策平台子系统、飞行计划统一管理子系统、塔台电子进程单子系统)、航班信息系统、雷达引接系统、电子值班系统等。这些系统的上线使用,极大的方便了管制员的工作,减轻了一线管制的工作压力。但随着信息系统的快速增多,问题也随之而来:系统间运维方式差异较大;系统版本还不够稳定;各系统的日常监控及应急处置手段不够齐全;运维人员的培训没有跟上业务增长的步伐……怎样做好这些系统的日常运维,怎样才能及时发现信息系统存在的问题,及时解决发生的故障就成为了一线运维部门的急需解决的难题。全国各地空管分局也在面临同样的问题,大家都在摸索中不断总结,不断前进。

中南空管局通信网络中心在2013年的时候就前瞻性地提出了“全面加强管制综合信息系统运维”。经过近3年来的努力,通过“一体化运维”概念的提出及实施,改变了以往粗放型的运维管理(遇到问题找厂家),呈现出较好的态势,满足了现场安全保障的需求。下面就将具体经验进行分享。

1 管综系统的日常监控运维

管制综合信息系统由于种类较多,信息交互复杂,各系统开发背景、用户使用环境不同,造成了运维界面复杂,因此,我们引入了一体化运维的概念,即运维讲究软件监控与硬件监控相结合,自动监控与人工辅助相结合。

1.1 软件方面

化繁为简,将管综系统看作是一套系统,各个子系统是被分解成的一个个独立模块,而模块又能分解成一个一个的“作业”“程序”。架构清晰了,只要能确保这些重要的点运行正常,管综系统的正常运行就有了基础保障。为此,运维部门针对各系统的重要作业开发了专门的监控网页,设置告警分类及告警音,较好的解决了故障难发现问题。

随着管综各套系统的研发,监控网页也就越来越多,根据现场运维人员的需求,又将监控网页进行了整合,分成两级监控,第一级是面向系统,第二级是面向程序、作业。至此,软件监控功能基本成型。

1.2 硬件方面

硬件监控也是必不可少的一个环节。空管服务器设备虽然属于商用级别,但硬件故障还是偶有发生,特别是服务器均为24小时在线运行、数据量日益增多都给服务器运行带来较大的压力。

我们主要依靠第三方监控软件实现了对所有管综的硬件监控,并达到了较好的经济效益。在这里,重点介绍两款经典监控软件:Whatsup与Solarwinds。其中Whatsup主要实现网络Ping功能的监控,人机交互界面较好。Solarwinds主要实现对CPU、内存、磁盘剩余空间等硬件方面的监控,此项功能极大简化了值班人员的巡视检查负担,且因为预警阀值的设置,往往能够提前介入,消除了运行过程中潜在的风险。仅2015年,通过硬件监控就成功处置了如虚拟机磁盘空间满;内存告警;固件版本老化;电池告警等10余起安全隐患。

1.3 人工辅助方面

设备监控性能再完善,最终解决问题的还得是依靠人。因此,值班人员的日常巡视也是必不可少的一个环节。技术人员要针对监控的死角、监控的重点等内容制定不同频次的人工巡视进行辅助。我们依靠巡视检查,能够解决及时发现问题,但如何能够实现及时解决问题呢?一是内部解决,另一个是外部解决。内部解决主要依靠现场运维人员的日常培训及故障经验总结,外部解决是委托给技术支持进行处置。

2 管综系统的故障经验积累

2.1 管综系统相关培训开展

首先,不能孤立地看待管综系统,对于运维人员来讲,所有的跟管制相关的信息系统都可以一体化的看待。这些系统不是孤立的,都可以看作管综系统的一个部分或者一个模块,有助于运维人员的理解及故障处理。

其次,培训不是一蹴而就的,是一个不断深入的过程。根据用户需求订制的培训才是高效、有效的培训。目前,中南各地往往由厂家在建设完毕后开展了扫盲培训班后就鲜有后续培训了,这主要是管理人员的责任。很多运维人员对于用户程序界面、操作流程都不清楚,又如何谈管综系统的运维?

再次,培训应采用多种模式,只要能够提升运维人员的水平提升就应主动申请。