首页 > 范文大全 > 正文

七个维度勾勒微波网络健康

开篇:润墨网以专业的文秘视角,为您筛选了一篇七个维度勾勒微波网络健康范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要 随着技术发展及国内实际业务场景需求,微波在国内的使用越来越多,带宽也越来越大,随着建网时间的推移和传输业务的大量增长,微波网络面临着设备及版本老旧、带宽不足、链路可靠性下降、网络运行状态亚健康等问题。本文根据作者经验,主要从技术上描述一个健康微波网络主要的关注点,从7个维度总结出健康微波网络主要关注点,希望能对微波工程师、微波维护项目能够有所帮助。

关键词 微波;网络维护;健康网络

中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2017)187-0074-02

1 微波传输网络健康的七个维度

一个健康的微波网络应该是一个什么样的网络呢?从笔者看来可以从七个维度来看一个微波网络是否健康。

2 微波传输网络健康的七个维度

一个健康的微波网络应该是一个什么样的网络呢?从笔者看来可以从七个维度来看一个微波网络是否健康。

2.1 管理可达

健康的网络首先是要能被管理的,上网管是基础,还要保持DCN管理顺畅,并且要保持物理拓扑和业务拓扑均要清晰。为了方便二线紧急或者疑难问题的定位,不慢而稳定的远程接入环境也是必须的。

和第三方、无线数通的对接、设备内部的连线等,目前各厂家基本都没有工具支撑自动的进行搜索和展现,必须靠手工进行定期的梳理刷新,并在网管上进行标注。这一点可以作为以后产品可服务性和工具的重点改进。

DCN子网规模需要注意,设计的时候一个子网不要太大,一般来讲不超过120个网元一个子网。更为重要的是,在微波网络中,由于交付人员技能和重视程度,不该链接的DCN通道没有关闭,导致DCN子网超大,网元的核心路由表“爆表”,这就需要及时进行DCN子网串网划分。

2.2 性能可视

微波网络中的容量管理和性能管理尤其重要,不光影响到现网的KPI,在有的时候,还可以促进创造新的专业服务乃至产品的销售机会点。

一般来说,当容量达到70%时,就要考虑扩容了,微波设备的缓存比较小,容易发生突发丢包,这种问题前面几年比较难定位,比较难找证据,这两年随着可服务性的改进,有了突发的丢包记录,要好多了,但较老的版本和设备型号还是比较难的。如果发现突发丢包较多,可以考虑在数通侧进行流量整形。

性能管理主要是对微波的链路可用度进行统计分析,并对与可用度设计值相差较远的链路进行优化。一般来讲,微波的链路可用度设计值是5个9(99.999%),不过可能个别项目有不同。链路可用度的改善措施包括不限于:调整天线、增加保护、电源整改、接地、排除干扰、馈线连接器以及更换设备等,需要单个链路单个分析。见过有代维项目客户纠结于接受电平与设计值偏差不得超过±3db,这个是比较难的,因为随着网路时间的推移,各种性能肯定有所劣化,这种严格的指标比较恼火,我们就可以用链路可用度和客户周旋一下。

2.3 组网合理

微波组网主要关注这个网络所运用的特性风险、保护程度、路由汇聚、微波长链。

特性风险主要关注功能特性的特点带来的风险。例如,专线业务比专网业务的工程交付难,但运维风险相对较小,因为专网容易带来环网风暴;MPLS承载的业务比Native业务要好维护,因为tunnel和PW的通道化和分层运维要比native业务逐一排查容易;专网E-LAN业务中802.1d网桥就比802.1q网桥组网的风险大,因为802.1q网桥有VLAN隔离广播风暴和MAC地址学习;EPLA就比LAG和PLA相对较好,因为EPLA没有LAG的负载不均衡副作用,不像PLA靠中频板进行流量分配;专网业务配置水平分割组比不配好,主要为了防止广播风暴等等。除了关注特性本身的特点外,对于新特性等要特别关注,使用的地方少,又比较新,容易存在未暴露的产品缺陷等。

微波网络有网络级保护、链路级保护、网元级保护、单板级保护以及业务级保护等。主要关注核心汇聚环、汇聚站点是否有保护,通常我们可以和路由器组VRRP,跨板LAG来保障上行链路的安全,采用ERPSh网保护来保护核心环上的以太网业务。对性能差的微波链路可以采用链路级的保护,核心网元采用主备主控的方式进行保护。另需要制定保护的定期倒换测试计划,检测备用通道是否良好。

路由汇聚其实和容量管理有些关联,主要就是看各个汇聚点能否均匀的分流,出了问题是否能够手工进行调整,尽量恢复业务。并且要避免出现微波长链,个人认为大于10跳链路就不太好了,容量汇聚、保护、时钟跟踪、时延性能等方面的影响就开始凸显了。特别是对于LTE网络,这一块特别重要。

当然,微波组网在网设时就应该打好基础,运维阶段调整相对较难,这一块也需要维护团队在做HLD设计时就尽量进行关注,多从后期维护和网络健康的维度提意见。

2.4 网元健康

当前微波的网元健康主要是通过厂家专用的巡检工具来进行巡检,除了巡检工具巡检外,还要在网管上关注紧急重要告警,数据库备份情况、网管上的离散业务等。

巡检工具巡检出的工程文件和数据进行再加工后分析和输出报告。主要能巡检出已知的产品缺陷,核心路由表规模、复位情况、全网的已经配置的保护的工作状态、数据库以及网元的软件健康状态、硬件状态以及能够巡检的配置问题等,一般巡检按照季度或者半年度展开。

很多故障在网管上也有告警展示,但由于微波网络往往较大有很多的网元,加之所处的环境比较复杂,现网往往成千上万的告警。所以定期对现网上的告警进行审视,要特别关注硬件类、设备软件包类、数据库类以及微波链路配置类告警,这些告警出现了但可能不会影响业务,但一旦掉电复位、重启就可能触发地雷,需要把这些告警及时的清理掉。并组织运维团队把一些没有业务的、无效的告警清理或者抑制。建议每周对网管上的告警进行核查。

另外数据库在网管上要定期备份,需要检查备份是否成功,不成功的要及时排查,一般是由于DCN问题、网元本身有问题导致。网管上的离散业务,能组合成端到端业务就进来组合成端到端I务,这样方便运维和管理,某项目TDM的离散业务上万条,结果客户都没有用TDM的业务了,这就造成了网络带宽的白白浪费。

由于各种原因,一个微波网络上可能使用了很多个版本,建议定期进行版本收编和归一到研发每半年推荐的主流维护版本中去,这样能有效防止各种已知问题和BUG的出现。升级也可以作为专业服务向客户销售。

2.5 问题可控

经常见到有的小问题,因为长时间得不到解决,没有受到重视,常常导致问题升级甚至持续对业务造成小范围影响甚至引发用户投诉,这就有些不值得了。而我们的运维团队也需要梳理出网络上的高发和常见问题,针对性的进行改进,及时发现可疑的质量或者批次问题。所以我们的团队要对现网的问题心里有数,做到可管可控。

建立问题单的跟踪闭环机制、升级处理机制,及时的消灭问题,避免扩大化。定期对问题单进行分门别类整理分析,从而找出一些共同点,一起促进现网和产品改进。

2.6 人员技能

由于本地化和降成本的原因,很多地方都没有专职的中方微波网络维护了,那本地员工的技能建设就非常重要。

个人觉得能力建设比较好的方法,除了定期组织本地员工进行学习产品知识外,还要本地员工进行案例输出和讲解,对于技能比较差或者上来只会换备件的本地员工,尤其如此,需要让他把自己的现网处理问题的操作过程拿来审视,和大家进行共享,这样才能印象深刻,快速成长。一味单方面的技能培训,效果不大,转身即忘。

让本地工程师定期学习、定期总结、进行案例分享,并针对性的进行改进,可以促进团队内的整体技能提升,也给了当事员工更多的鞭策动力,促进工程师熟悉整个微波网络,规范操作,也能有效改善团队内的气氛。

2.7 站点支持

微波网络特有的就是链路一断,DCN就中断了,这就需要站点工程师的及时到位支撑才能快速的恢复业务,站点工程师的配备和常驻地点分配和网络拓扑以及风险容忍度相关。

另外充足的备件必不可少,根据现网设备的数量和该硬件的易损度来准备充足的备件,尤其是站点难以进入的地方,在建设初期就应该考虑备件问题。

3 结论

微波网络因为量大,随处可见,并且经常处于山区、海岛、戈壁、丛林等光纤抵达不了的偏僻地区,导致站点维护困难,海量的站点又导致不能每个站点面面俱到。又因为微波属于空间无线传输,看不见摸不着,空间链路相关的问题难以定位,再加上网络层级不高,投入不足等,所以要做好微波的维护工作也是非常不容易的。从笔者经验看,30分钟的事故恢复要求对于微波来说是非常困难的,平时有效的管理,对网络状态清晰可见,及时的排除风险,才能有效降低我们遇到事故无法及时恢复的风险。

参考文献

[1]李玲玲.黑龙江移动经营分析系统网管信息应用实现[D].哈尔滨:哈尔滨理工大学,2007.

作者简介:石磊,中国铁塔股份有限公司烟台市分公司综合部。

康明浩,中国联合网络通信有限公司烟台市分公司网络建设部。