首页 > 范文大全 > 正文

监控中心站服务器上传故障预警处理系统

开篇:润墨网以专业的文秘视角,为您筛选了一篇监控中心站服务器上传故障预警处理系统范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]本文介绍了顾北矿监控队由实践出经验,由工作出创新,逐步摸索对上传系统的改造方式方法,并通过对上传系统的改造,避免了故障率,取得了良好的实践效果。

[关键词]监控中心站;服务器上传;软硬件改造;故障预警

1.前言

监控中心站是监控队的心脏部门,主要负责监控井下的各种数据,随时注意机房各种机器的运行情况和各种数据参数的变化,发现异常以及不安全隐患要及时准确的汇报值班人员并认真做好各项记录。在监控的各种数据中,集团公司对各矿数据服务器向集团公司信息分公司上传情况尤为关注,有具体的规定。如:上传软件不得有测点筛选功能,确保安全监控联网信息的真实性;遇特殊原因确需中断上传的,书面申请经矿长(经理)签字后,提前报告集团公司调度室;人为造成中断的,按照事故追查处理;信息分公司每月将各单位监控系统联网的运行情况进行总结统计,并将结果公布在集团公司网站上。以上等等规定就对我们机房的服务器上传系统提出了更高的要求。上传系统必须能及时地发出预防性报警、通知有关人员、采取措施、防止故障发生。

2.系统简介

2.1改造前的上传系统

服务器上传的流程是将数据采集服务器上从井下采集的数据重新分类整理,然后上传到集团公司信息分公司的FTP服务器上,上传过程为不可逆,通过不断重复数据的上传从而实现集团公司对各个矿数据的统一监控,由于上文提到集团公司对上传过程有很多具体的规定限制,所以就要求我们保障上传机的稳定运行,一旦有问题早发现、早解决。

2.2影响上传的各个因素

由于数据上传是个复杂的过程,有很多的中间环节因素影响,这就要求我们对各个环节都做好保障,以实现上传的稳定。影响上传过程的因素有:服务器系统的安全性,上传软件的稳定性,上传网络的稳定性等等,根据各个环节制定特定措施是保障上传机稳定运行数据上传的唯一方法,

2.3上传系统改造的必要性

报警(alarm)是报告事件的发生,是在故障或危害发生之后向管理人员发送警讯,及时地发送警讯可以缩短故障修复时间(MTTR),最大程度地保障系统运行。但故障还是不可避免地发生了,影响了系统的正常运行。

预警(alert)则是在故障或危害发生之前向管理人员报告潜在危机,提示相关人员进行处理,是事前的,可以防止事故的发生。有效的预警可以增加系统平均无故障工作时间(MTBF),并可以根据危机情况自动延伸到报警。

预警与报警的区别就在于它是事前预防性报警,监控机房系统只有具有良好的预警功能才能侦测出潜在危机并分层次逐步扩大警讯发送范围,有效地防止事故的发生,将损失降低到最小。意识到预警的重要性,从而通过改造实现监控机房上传系统预警功能就十分必要了。

2.4相关改造方案

2.4.1基础设施改造

为保障服务器系统的安全性,我们在上传服务器上已安装杀毒软件和防火墙的基础上在网络上增加了一台瑞星网络硬件防火墙,并在设置里完全限制服务器上网功能及其它网络用户远程连接本服务器功能,只打开上传用的特定端口,从而完全限制了网络病毒的入侵途径,大大提高了上传服务器系统的安全性。

2.4.2上传系统预警功能的改造

在这里需要重点说明的是通过上传系统的整合改造从而实现的上传故障预警处理功能。

那么,监控机房上传系统该如何实现预警功能呢?

首先,是软件改造。通过和软件开发厂家的联系沟通,共同开发了上传软件的故障声光报警功能,集团公司的规定是上传中断十分钟以上作为一次中断事故记录处理,我们的软件经过改造后设置成当上传出现各种故障影响上传时自动发出报警声,提醒值班人员注意,使值班人员能够迅速做出反应,如通知技术人员处理故障,这样大大缩短了发现故障时间,降低故障造成中断事故发生的概率;

其次,是硬件改造。原上传服务器为浪潮的单一服务器,由于硬件的局限性,服务器无法发出声音报警,现在经过硬件改造升级,实现了服务器故障发出声音功能,确保了值班人员能够听到报警讯号,在硬件上保证了监控机房上传系统预警功能的实现;另外,监控机房增加了一台上传服务器,实现了集团公司要求的双机双上传功能,能够在主上传服务器出现故障时迅速切换至备用服务器上传,大大降低了上传中断事故的发生;

再次,是通过制定相关的规章制度,设置了多个详细的预警流程,明确规定了监控机房值班人员在出现各种故障现象时的汇报流程,确保不同的相关人员在不同时间接收到不同程度的警讯。从而迅速到达现场做出处理,降低上传中断事故发生的可能性

3.上传故障预警处理系统实施效果

在监控中心站上传故障预警处理系统实施后,我矿监控上传中断次数明显下降。集团公司信息分公司每月在网站上公布的各矿监控系统联网的运行统计表中,我矿监控机房上传故障次数由原来的屡次每月的十几二十次变为现在每月几次甚至为零,新实施的上传故障预警处理系统起到了重要的作用。

作者简介:

王彦开(1983-),男,河北沙河市人。2007年毕业于河北理工大学,助理工程师,主要从事煤矿一通三防技术管理工作。

傅强(1984-),男,湖南醴陵人。2007年毕业于中国矿业大学,助理工程师,主要从事煤矿一通三防技术管理工作。