首页 > 范文大全 > 正文

网络安全预测仿真研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇网络安全预测仿真研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

1引言

随着网络技术迅速发展,网络朝着规模化发展,网络攻击手段层次不穷,传统防御和检测模式无法满足网络安全监控要求[1]。网络态势安全能够根据网络的当前安全状况,对未来一段时间内网络安全状况进行预测,使网络在遭受攻击前,采取相应防范措施,因此对网络安全态势进行准确预测具有重要意义[2]。网络安全态势预测实际是一个回归问题,传统预测方法主要为时间序列分析法,由于网络安全变化具有时变性、非线性,时间序列难以描述网络当前状态和未来状态之间关系,预测精度低[3]。随着人工智能算法不断发展和成熟,出现了基于神经网络、支持向量机(SVM)、马尔可夫链等网络安全态势预测算法,获得了较高的预测精度[4-6]。但是大量研究发现,这些方法均存在各自缺陷:马尔可夫难以建立准确预测模型,需要进行大量的数学公式推导,较复杂;神经网络存在参数选取困难、网络收敛速度慢和易陷于局部极小点等缺陷,导致预测结果易过拟合现象;SVM虽解决了神经网络的过拟合缺陷,但其参数选择没有理论指导,得到的参数主观性、盲目性较强,样本过大时,训练速度慢等缺陷[7]。综合上述可知,采用人工智能方法对网络安全态势进行预测,要获得较高的预测精度,必须对预测模型参数进行优化。近几年,出现了遗传算法、粒子群算法、蚁群算法和人工鱼群算法,为模型参数提供了一种新的优化工具[8]。针对网络安全态势预测模型存在参数优化难题,提出一种遗传算法和SVM相结合的网络安全态势组合预测模型。

2网络安全态势预测系统的结构

网络安全态势预测就是利用时间序列数据之间关系,对未来时刻的网络安全态势值进行预测,由于网络安全态势具有时变性、随机性和不确定性,传统预测模型难以建立准确、合理预测模型,SVM能够模拟人的思维、自学习、自织织能力,十分适合于对网络安全态势预测。基于支持向量机的网络安全态势组合预测模型由3个模块组成:数据处理模块、预测模型生成模块和结果输出模块,具体如图1所示。1)数据处理模块首先将采集的网络安全态势值进行归一化处理,然后对数据进行拓阶处理,最后采用获得最优阶数对数据进行重构,得到模型的训练和测试样本集。2)预测模型生成模块该模块主要由SVM和遗传算法组成。将网络安全态势的训练样本集输入到SVM进行学习,并采用遗传算法得到的SVM初始训练参数进行第1次学习和训练,得到网络安全态势的初始预测模型,然后采用建立的初始预测模型对测试样本集,得到测试样本的态势值预测值;采用预测值与实际值之间误差的倒数作为个体适应度函数值,对算法终止条件进行判断,如果满足,就得到网络安全态势的最终预测模型,否则对遗传算法的个体进行选择、交叉、变异等遗传操作,不断迭代直至满足终止条件为止,从而获得网安全态势的预测模型。3)结果输出模型。对将来网络安全的态势进行预测,根据预测安全态势值相应的网络安全告警。

3网络安全态势预测模型

3.1数据归一化处理由于网络安全态势值变化范围比较大,对SVM的训练速度产生不利影响,因此,将重构的数据输入到模型进行学习之间,就对其进行归一化处理,具体归一化公为:

3.2网络安全态势数据重构网络安全态势数据是一个一维时间序列,即每一个时间监测点对应一个网络态势值,因此在输入到SVM进行学习之间,需要对其进行重构,变成一个多维时间序列,本文采用拓对重构后的安全态势数据划分训练集和测试集,训练集用于SVM训练建立网络安全态势预测模型,预测集用于检测建立的网络安全态势预测模型的预测精度。

3.3网络安全态势预测设共有n个网络安全态势学习样本{xi,yi},i=1,2,…,n,其中xi为输入,yi为输出期望值,SVM回归方程为:对于非线性回归预测问题,防止可避免维数灾难题,采用核函数k(xi,x)代替(φ(xi),φ(x)),防止可避免维数灾难。则有:3.4网络安预测模型的参数优化基于SVM的网络安预测模型对参数的选取十分敏感,训练参数选取是否合理直接决定了模型的最终预测精度。SVM参数共包括惩罚因子C、核函数参数σ,不敏感损失函参数ε,C取值过大或过小会产生过学习或欠学习缺陷,σ值决定了预测模型的泛化能力,ε取值决定着支持向量数目和计算复杂度,因本文采用遗传算法对参数C、σ和ε进行优化。具体思想为:首先采用随机方式产生k组参数C、σ和ε初始组合,然后将k组参数作为SVM参数对训练集进行学习,并对测试集的预测值,计算预测值和实际值的误差的倒数并作为个体适应度值,并不断迭代,最终获得SVM的最优参数:C、σ和ε组合。采用最优参数:C、σ和ε对训练样本重新学习,建立最优网络安全态势模型,并对未来时刻的网络安全态势值进行预测。

3.5网络安全态势预测模型的完整工作流程综合上述可知,网络安全态势预测模型的完整工作流程如图2所示。

4仿真研究

4.1数据来源为了组合网络安全态势预测模型的性能,选取某公司服务器2010年10月1日-12月1日网络攻击频率数据作为仿真数据,每天对网络状态采样4次,每一个采样数据作为态势值,共获得240一维时间序列数据,前180个数据组合训练集,最后60个数据组成测试集,数据具体如图3所示。

4.2最佳时阶数确定首先对原始网络安全态势数据进行归一化处理,然后逐渐拓展网络安全态势时间序列的阶数,最后确定最佳时阶数为4,即SVM的输入向量为4个,对网络安全态势数据进行重构,得到网络安全态势的多维时间序列样本集。

4.3预测结果所有实验均在matlab7.0平台下实现,调用遗传算法和SVM工具箱进行编码,采用一步预测法,将重构的训练集输入到SVM进行学习,遗传算法对数进行优化,预测平均误差随着迭代次数的增加的变化曲线如图4所示。最后得到SVM的最优参数为:C=10,σ=0.625,ε=0.001。采用C=10,σ=0.625,ε=0.001对训练集重新学习,建立最优网络安全态势预测模型,并对测试集进行预测,得到的预测结果如图5所示。从图5的预测结果可知,本文的网络安全态势组合模型的预测值与实际值比较接近,预测精度较高,达到了网络安全态势预测的要求,是一种有效的网络安全态势预测算法,预测结果可以为网络管理人员有价格的参考信息。

4.4与其它预测算法对比实验进一步验证网络安全态势组合预测模型的优越性,选取未经参数优化的SVM算法(SVM)和BP神经网络算法(BPNN)进行对比实验。SVM采用默认的网格搜索算法进行参数优化,BPNN采用默认梯度下降算法进行权重和阈值优化,模型的评价指示为平均绝对误差和均方误差。比对实验预测曲线如图6所示,预测结果的各种误差见表2。从表2和图6的预测对比结果可知,BPNN对网络安全态势进行预测,收敛速度慢,权重和阈值优化困难,极易陷于局部极小点,导致预测误差比较大,预测精度低;其次,使用未经参数优化的SVM型,采用网格搜索参数,盲目性太大,搜索进行长,难以获得模型最优参数,预测结果不理想,而本文提出采用遗传算法对SVM参数进行优化,可以动态调整SVM参数,很好的克服传统SVM和BP神经网络存在的缺陷,泛化能力优异,获得较高的预测精度,预测结果具有较高实用价值。

5结束语

网络安全态势变化具有时变性和非线性,是一种复杂系统,传统SVM存在参数优化难题,预测精度不高,为此,本文提出一种基于一种遗传算法和SVM相结合的网络安全态势组合预测模型。仿真实结果表明,采用遗传算法全局搜索能力很好地解决了SVM参数优化难题,有效提高了网络安全态势预测精度。相对于其它网络安全态势预测算法,本文算法的预测结果更可靠、更有效,可以很好地反映和刻画网络的整体安全运行状况,预测结果可以指导管理员对网络安全进行有效控制。