首页 > 范文大全 > 正文

流量测量论文:现代网络流量测量方法透析

开篇:润墨网以专业的文秘视角,为您筛选了一篇流量测量论文:现代网络流量测量方法透析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

作者:马知也 单位:兰州职业技术学院

网络流量采集方法

对经过该链路的流量进行监听和捕获,按一定格式将流量数据进行编码,或者将其汇聚为流数据,发送给后台的接受存储设备.IPFIX工作组[3]定义了采集设备将流量发送给后台接受设备的协议及数据格式.数据存储模块对采集并初步处理后的数据在存储设备中进行存储以备进行下一步数据分析.小型测量系统存储数据到本地采集系统的硬盘上,并实时的进行分析处理和应用.而在大型测量系统中一般有专用的中心存储设备来存储数据,通过专用或普通链路接受各个测量结点捕获的数据.数据分析部分对流量特征进行分析,并将这些数据用于计费、异常检测等应用.网络设备支持的流量采集有些路由器或交换机本身具有流量采集的功能,在进行路由转发等功能的同时,它们可以通过专用的硬件设备采集网络流量数据,并进行初步处理,然后将其转发到后台专用流量接收设备.目前网络设备中应用广泛的Cisco公司的Netflow和基于网络设备流量采集标准的sFlow两种流量采集技术.Netflow通过采集数据分组,根据配置对其进行抽样,并对具有相同“流关键字”的分组聚合形成为流信息,然后通过定义的格式把流信息发送到后台的流量接收服务器,再由后台服务器对流信息进行存储、分析等工作,从而实现完整的流量测量.而sFlow流量采集技术是将sFlowAgent嵌入在交换机和路由器等网络设备中,它负责对流量进行监视,并将采集的信息发送给后台的接收服务器.sFlowAgent通过对数据进行抽样而减少向后台服务器发送数据量.基于网络设备支持的流量采集技术一般被用于计费和流量分析等领域.随着网络速度的提高,流量采集功能的使用会对路由器、交换机本身的转发性能产生一定程度的影响,另一方面这种粗粒度的信息对于某些需要详细分组信息的应用也存在着不足.基于网卡采集在正常应用中,网卡从网络接口接收数据分组,然后将它传递到上层应用.基于网卡的流量采集方法有正常应用模式和混杂模式两种.在正常应用模式下,网卡只接收发送给自己的数据分组.而在混杂模式下,网卡可以接收所有到达的数据分组,硬件不对分组进行过滤,所有分组都会进入系统的内核.因此,当一个网卡专门用于流量数据采集时,一般应设置为混杂模式.专用设备进行采集虽然通过一系列技术改进措施,普通网卡结合计算机的网络流量采集技术可以对普通链路进行流量数据采集.但对于高带宽的链路,应该采用专用的硬件设备进行流量数据采集.一些公司推出了专用的流量采集设备,如Endace公司的DAG卡[4],NetScout公司的nGeniusProbes、nGeniusInfiniS-tream产品[5],以及一些基于网络处理器的流量采集方案等.这些专用设备使用高性能专用硬件实现数据采集工作,性能上较前两种采集方法有了很大的提高.并行采集随着网络速度的高速发展,单个设备的采集能力已经很难适应流量数据的采集.因此,利用多个采集设备并行完成流量采集任务成为一个较好的选择.但为了保证各个采集设备的负载均衡,必须对分流设备的分流策略进行仔细设计.如果分组被分到多个流量采集设备,那么将会给后续的汇总处理程序带来一定的困难.为了使多个采集系统在数据采集上一致,并保证数据集的完整性,多个采集系统之间必须解决时间同步等问题.

网络流量测量模型

在现实中许多比较难以解决的问题,一般解决方法是先建立问题模型,模拟一定的场景和条件,然后在这些场景和条件下对问题进行模拟解决.由于互联网络的异构型和网络高突发性业务量使得网络呈现复杂的非线性,为了有效的对网络流量进行测量,就需要建立一定的网络流量测量模型,而且这种模型的建立也是非常有必要的.首先建立仿真模型对真实网络流量进行描述,这种模型还能够对网络流量将来的行为趋势有效地进行预测.传统的网络流量模型多以泊松过程为基础,其中有泊松模型、马尔科夫模型、自回归模型、自回归移动平均模型和自回归合成移动平均模型等,这些模型同属于短期相关性模型,即若测量时间的间隔足够大的时候,当前时刻所采集到的业务流量与过去时间所采集到的业务流量不具有相关性.从时间的角度来看,这些模型所采集的数据流量具有短相关性,随着测量时间间隔的变大,网络流量会趋于一个恒定的常量,也就是说,网络流量突发性得到了一定的缓和,因此,传统网络流量测量模型并不能描述网络性能的长相关性.对网络流量自相似性进行深入研究后发现,自相似网络中业务流量在较大的时间间隔具有突发性,并且这种业务流量的长相关性比较明显.因此,传统流量模型一般不适合用来进行自相似流量的模型建立.所以,目前对网络流量的描述逐渐采用自相似模型,这种模型能够表征长相关性与突发性.自相似性网络流量模型以自相似过程为基础而建立,模型在精度和灵活性方面与统计特性下建立的模型比较并没有什么优势,甚至没有统计特性下建立的模型好,但其具有明确的物理意义,有助于理解网络流量产生自相似的原理.在自相似性网络流量模型中流叠加算法使用较多.ON/OFF流叠加模型定义叠加大量的ON/OFF源,每个源都有两个周期交替的ON和OFF状态.在ON状态时,数据源通过连续的速率发送数据包;在OFF状态时,数据源不发送任何数据包.在这一过程中,所有发送源都出于ON或OFF状态的时长独立地附和重尾分布.对于网络流量统计模型是以其统计特性下表现出的性质为基础而建立模型,这一类模型相比其它模型虽然在灵活性和精确方面占有一定优势,但其并没有具体明确的物理意义.分形布朗运动、分形ARIMA过程、多重分形小波模型和小波域独立高斯模型都属于这一类模型.虽然自相似性测量模型以网络特征为基础而建立的模型,它可以对业务流量的自相似特性和流量突发性与长相关性进行描述,可以全面认识网络业务流各个方面的内在规律,在一定条件下能够取得较好的预测效果.但实际的网络业务流中,既有短相关特性,又有长相关特性,这种短相关特性与长相关特性并存的多种特性给网络业务流量精确预测带来很大的挑战.因此,自相似网络流量模型对网络流量的所有特性也不能完全描述.