首页 > 范文大全 > 正文

“云网管”,大规模服务器监测破局

开篇:润墨网以专业的文秘视角,为您筛选了一篇“云网管”,大规模服务器监测破局范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

在传统IT运维解决方案中,如何进行监测服务器的扩容是最大的难题之一,而“云网管”技术将虚拟化引入到了监测服务器系统,有望为解决这一难题提供新的途径。

在目前的网络运维管理实践中,随着用户业务的不断发展以及数据中心建设的不断扩大,用户要监测的网络设备规模越来越庞大、投入监测服务器的成本越来越高。

用户的运维管理实践在不断发生变化,运维管理软件市场已经由对单一工具集产品的需求转变为对完整解决方案的需求。用户越来越需要一场新的技术变革来突破当前所面临的挑战和困局。

网络运维管理发展之困

美信时代科技有限公司(以下简称“MXsoft”)技术总监陈新刚说:“在这样的背景下我们推出了全新的CreCloud云网管(以下简称CreCloud)完整解决方案。其设计原理可以简单概括为:将多台普通监控服务器虚拟为一台计算能力强、运行稳定的大型监控服务器,帮助用户在低成本的情况下,实现对大规模服务器和网络设备的监控。CreCloud作为一个完整的解决方案,从根本上革命性的解决了传统网管产品所无法解决的种种问题。”

问题一:传统网管产品的监控能力和庞大的网络规模之间的矛盾。

MXsoft的技术总监陈新刚认为,在大家熟知的网管领域中,不管是简单还是复杂,传统网管产品都是以单套部署的原理来工作。即一套产品只能安装在一台监控服务器上,这种模式有一定的局限性,其监控能力和规模都受限于这台监控服务器的性能。当被监控规模超过这台服务器监控极限时,用户不得不再购买一套产品,安装在另一台监控服务器上,对超出部分的被监控对象行进监控。同时,还需要对用户、权限和预告警数值等参数重新设置。这无疑会大大增加人力、物力上的成本。监控的目的是为了提高工作效率,多套传统网管产品的部署在解决问题的同时却大大增加了对管理工作的复杂度。

所以传统网管产品对于大范围的网络监控往往力不从心。而目前,有很大一部分的用户需要监测的设备越来越多,比较典型的是门户网站、网游公司和类似中石油这样的大型工业企业,动辄就要监测上千台服务器。传统网管软件已渐渐无法满足这类大中型规模企业的需求了。

问题二:传统网管产品的不可扩展和未来监测扩容之间的矛盾。

传统网管产品由于采用单套部署的方式,当监测容量达到软件自身的限制时,比如监测服务器和网络设备达到100台时,性能就会大幅下降,当达到500台时,就会保持极限运行,随时都有发生故障的可能。

目前国内的许多行业客户都在大力发展信息化建设,IT业务处于快速增加之中,设备和应用轻松就会达到上百个,这样当监测需要扩容时,网管产品却出现了瓶颈,不能随着IT网络的扩容而自适应增加管理能力。如果实现监测扩容,就需要新增加一套或者多套网管产品,这样管理的效率问题就随之而来。

“云网管”解决之道

随着新型的互联网和IT应用层出不穷,用户的数据中心越来越大,服务器和网络设备的数量越来越多,这些海量设备的存在为运维管理提出了新的挑战。

陈新刚表示:“为了从根本上解决以上网络运维管理所面临的困境,MXsoft将云计算的概念引入到这个领域中,推出了CreCioud云网管产品。云计算有两个最根本的特征:虚拟化和动态扩容,在CreCloud的产品设计中,我们充分地体现了这两个特征,CreCloud通过把多台服务器的监测能力虚拟成一台超级服务器,实现了虚拟化监测。当数据中心的服务器和网络设备增加时,CreCloud通过增加‘监测云’中的服务器来实现动态扩容”。

以往当需要对大规模服务器进行海量监测时,传统的方法是使用多台性能配置高的硬件服务器,部署多套网管产品来分割进行。而现在应用CreCloud的“云管理”技术,用户可以将多台PC Server进行虚拟,构建出一个性能强劲的虚拟服务器,CreCloud完全满足了用户对大规模监测的稳定可靠性、持久安全性、灵活扩展性的需求。

如图一所示,CreCloud云网管主要创新成就包括如下几个部分:

中央控制器(Central Control Unit,简称CCU),是CreCloud云网管的大脑,主要负责协调、管理、分配众多的任务管理器和实时数据库,实现云管理方案中的各项功能。

TaskDispatcher任务管理器,主要负责调度管理由CCU中央控制器分配过来的监测任务,通常情况下,一个TaskDispatcher任务管理器可以完成对1000台服务器(或者网络设备)的监测。如上图所示,TaskDispatcher任务管理器所管理下的监测服务器组成监测云,完成对大规模设备的海量监控。该监测云具备动态监测负载均衡、多机容灾备份、监测服务器热插拔等众多功能。

在陈新刚看来:“用户的核心需求是管理设备,而不仅仅是购买工具。由于CreCloud可以使主控机实现双机热备和虚拟可动态扩容,两台主控制台服务器组成高效的‘主’一‘备’模式,‘主’服务器和‘备’服务器之间通过‘智能心跳’技术实时关联,一旦主控制服务器宕机,备份服务器马上启动执行任务。不但解决了用户目前7*24小时的不间断监测需求,也为用户未来系统扩容的需求做好了准备。”

陈新刚强调:“其实云网管可以提供给用户的不仅仅是一套工具,而是一整套解决方案。网络运维管理的主要瓶颈之一就是数据库分析这一层,能否把监测采集到的数据进行快速存贮和精准分析是衡量网络管理系统优劣的重要指标。MXsoft通过自主开发数据库与用户指定数据库相结合,满足了不同客户对监测数据的存储需求,既可以将数据存在用户指定的数据库中,同时也可以在自己的数据库中进行备份。”

据介绍,这种“云网管”技术所面向的用户群体是比较高端、拥有大量服务器的用户,MXsoft已经瞄准了例如门户网站、网络游戏和大型国企、电信等多个领域,准备发力。陈新刚还透露,明年可能会CreCloud的日本版和英文版,进军海外市场。在谈到网络运维领域未来的技术趋势时陈新刚自信地指出,“越是听上去简单易懂的技术,越需要深厚的积累和复杂的工作。云网管是一个势在必行的趋势。因为目前面对大规模服务器监控,传统网管产品已经无法满足需要。所以我们对这个市场的前景充满信心。”