首页 > 文章中心 > 梯度下降法的基本原理

梯度下降法的基本原理

开篇:润墨网以专业的文秘视角,为您筛选了八篇梯度下降法的基本原理范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

梯度下降法的基本原理范文第1篇

Abstract: This paper presents a way to apply adaptive neural network model for blind source separation algorithm in the separation of radar signals,radar signals should be considered include the echo signal and interference signals and noise as Gaussian white noise,following the blind source separation theory and assuming that the signal and noise are mutual independence,the use of adaptive incomplete natural gradient method realizes the effective separation of radar signals. New algorithm has solved the traditional complex separation of radar signal filtering,but also provides a more objective guidance for adaptive neural network system being applied more widely.

关键词:雷达信号;自适应;盲源分离

Key words: radar signal;adaptive;blind source separation

中图分类号:TN95 文献标识码:A文章编号:1006-4311(2010)30-0211-02

0引言

雷达系统在工作状态中的接收信号包括回波信号、干扰信号、杂波信号、内部噪声等,雷达工作环境的恶化和日益复杂的电子战信号环境,使现代雷达系统面临严峻挑战,使得各式雷达都必须具备非常强的干扰环境中检测目标和提取目标参数的能力[1]。对于较简单的干扰模式,现有的雷达信号处理模块通过经典的滤波理论和传统的信号处理方法加以处理,就可以获取较佳的效果。随着干扰信号模式愈来愈复杂多变,现代雷达侦察设备的信号分选任务也十分艰巨而复杂,传统方法已无法胜任这方面的工作。因为传统的“主动雷达”为了探测目标必须发出电波信号,很容易因暴露自身而遭到攻击,所以使用受到很大限制。相反,近年来发展起来的“被动雷达”(暂且称其为雷达),由于只接收信号而不发出任何信号就可以探测到目标,因而受到各国的广泛重视,实际上,这种被动雷达工作的基本原理就是盲源分离技术。我国这几年来对隐形飞机探测研究所取得的成就也正是将盲源分离领域的最新研究成果应用于上述这类被动雷达的一个具体生动的例子。

盲分离技术是近年来信号处理技术的重要发展方向,是指信号分离时,我们无法预知原始信号和传输信道的基本信息,仅根据接收到的混合信号有效地将图像或信息分离[2]。利用盲信号分离技术能很好地解决复杂环境背景下雷达信号分选的问题,它无需考虑过多的雷达信号的环境、条件的可测性。学习样本的选取,只需根据接收设备所获取的雷达辐射源信号进行处理,就可以得到原始信号的形式,即恢复出原始信号,为电子战中对抗和反对抗采取措施提供了重要的依据。

1雷达信号盲分离的数学模型

雷达对抗信号环境S(t)是指雷达对抗设备在其所在的地域内存在的各种雷达辐射、散射信号的整体,数学表达式为:

S(t)=Si(t)(1)

雷达信号的干扰信号包括噪声干扰信号和人为干扰信号。噪声干扰信号一般有噪声调幅干扰信号、压制性干扰信号、噪声调幅―调频干扰信号。人为干扰信号形式繁多,本文以典型的高斯噪声和线性调频信号作为干扰信号为例。系统有M路接收通道,相互等距为d,有N路窄带信号,气象雷达接收信号模型可表示为:

X(t)=As(t)+n(t)(2)

其中,X(t)为雷达接收到的观测信号,A=M×N为混叠矩阵,它为天线阵的响应函数和转播过程中的混叠矩阵的乘积,S(t)为M×1维源信号,包括回波信号和干扰信号等,假设各信号之间与噪声之间均是相互独立;n(t)为N×1维噪声信号,包括外部噪声,内部噪声和电噪声等,通常视为高斯白噪声。

雷达接收机处理数据是通过回波信号和本振信号进行混频,并对混频信号进行调节和跟踪,在复杂的信号背景下,利用自适应神经网络分离系统区分干扰和目标信号,关键在于如何求解一个好的分离系统,这里我们采用两步法――白化矩阵U和分离矩阵W来完成分离的目的。

因此,解混矩阵的数学表达式为:

y(t)=Bx(t)=UWx(t)(3)

其中,y(t)=(y1(t),y2(t),L,yn(t))表示恢复出来的信号,是对原始信号S(t)的估计。盲分离的过程,就是根据对源信号S(t)的性质和特征的假设,建立解混矩阵B的目标函数,使得通过解混矩阵B的输出信号y(t)尽可能地逼近S(t)。由(2)、(3)式得:

y(t)=Bx(t)=BAs(t)=Gs(t)(4)

G称为全局矩阵,最理想的分离效果是G=I(I为n×n阶单位矩阵),即B=A-1。所以盲分离算法的核心问题就是如何寻找到分离矩阵的最佳估计值,它包括两个方面:优化判据(或比值函数)和寻优算法,即学习时首先建立一个以已知信息元素为变元的目标函数ρ,其次是寻找一种有效的算法求解W,若能够算出某个能使ρ达到极大(小)的值,该极值点即为W所需的解。

2雷达信号的自适应不完整自然梯度盲分离算法

如何求得分离矩阵W,是ICA的核心问题。通常这个问题需要基于目标函数的方法进行求解,ICA问题的解B将在这些目标函数的极小或极大值处找到。因此,对于极小化一个多元函数的无约束问题,最经典的方法就是最速下降法,也称为梯度下降法。本文采用不完整自然梯度法,具体如公式:

W(k+1)=W(k)+μ[Λ-F(Y)]W(k)(5)

不完整自然梯度学习算法的特点是当源信号幅度随时间快速变化或在某段时间为零时,仍能很好地工作,甚至在过高估计源信号数目时,算法性能也不会出现较大波动。而标准自然梯度算法则不具备这种能力,它们会放大不包含在源信号内的微小分量,造成算法性能的恶化,这点Amari等人在文献[3,4]中加以论证,而在具体的仿真实验中,不完整自然梯度算法的分离效果和稳定性也强于自然梯度法,因此本文将采取不完整自然梯度法进行图像分离。公式中步长因子μ的作用是控制分离矩阵W在每次迭代过程中的更新幅度,本文中主要验证自适应算法的可行性,故采用固定步长。

最终得到本文不完整自然梯度变步长算法的具体实现步骤如下:

①对混合数据X进行中心化,使其均值为零;

②白化:估计白化阵U,获得白化数据Z=UX;

③设置初始分离矩阵W。根据需要处理的信号选择合适的φ(・)函数。选择初始步长μ(k)

④计算Y=WZ;

⑤计算F(Y)=φ(Y)YT,从F(Y)中获得Λ=diag{λ1,L,λn},其中元素λi=F(Y)中正对角线元素;

⑥更新分离矩阵

W(k+1)=W(k)+μ[Λ-F(Y)]W(6)

⑦如果尚未收敛,返回步骤4,继续迭代直至收敛。

3仿真实现

假设位于接收机阵列远场有4个雷达信号源,且各雷达信号源之间是相互独立的,噪声为零均值高斯噪声,各接收机噪声之间是相互独立的,信号源与噪声之间也是相互独立的,假设各信号源为4个正弦波调制信号,它们的包络和载频各不相同,运用本文的分选算法可以得到无噪声的仿真结果如图1所示。

4结束语

一直以来,独立分量分析作为成熟的盲源分离算法,在理论和实际应用上都取得了很大的发展,被广泛地应用于各个学科领域,出现了许多热门方向。而自适应神经网络盲源分离技术是近几年来发展起来的一门新型技术学科,以其无需较多先验知识、快速有效的分离特点,得到更多科研人员的关注,本文把盲源分离技术应用到雷达信号的分离上,并通过算法分析和仿真实验证明了算法的可行性,为雷达技术的发展方向提供了较好的参考价值。

参考文献:

[1]杨建民,黄晓刚,徐佳龙,等.基于信号处理优化设计的雷达性能改进[J].现代雷达,2010,3(32):21-23.

[2]杨福生,洪波.独立分量分析的原理与应用[M].北京:清华大学出版社,2006.

[3]Amari S,Cichocki A,Yang HH. A new learning algorithm for blind signal separation[J].Advances in neural information processing systems,1996:757-763.

梯度下降法的基本原理范文第2篇

关键词:磁分离技术 原理 应用 发展

1、引言

磁分离技术是借助磁场力的作用,对磁性不同的物质进行分离的一种物理分离方法。磁分离技术是一门新兴的环境保护技术, 国外自70 年代开始进行研究以来, 磁分离技术作为物理处理技术已成功地应用于城市工业废水和生活污水、废料、污染的河水、湖水以及饮用水的处理,上世纪80 年代以来, 我国开始了这一领域的研究[1]。本文主要介绍水处理工程中磁分离技术的应用工艺。

2、磁分离技术的原理

磁场本身是一种具有特殊能量的场,经磁场处理过的水或水溶液,其光学性质、导电率、介电常数、粘度、化学反应及表面张力和吸附、凝聚作用及电化学效应等方面的特性都产生了可测量的变化[2],并且当撤掉磁场后,这种变化能保持数小时或数天,具有记忆效应。由于这些现象的存在,多年来磁技术一直是研究热点。

废水中的污染物种类很多, 对于具有较强磁性的污染物, 可直接用高梯度磁分离技术分离; 对于磁性较弱的污染物可先投加磁种( 如铁粉、磁铁矿、赤铁矿微粒等) 和混凝剂,使磁种与污染物结合, 然后用高梯度磁分离技术除去。磁分离的物理作用基本原理就是通过外加磁场产生磁力, 把废水中具有磁性的悬浮颗粒吸出, 使之与废水分离, 达到去除或回收的目的。

磁分离技术应用于废水处理有3 种方法: 直接磁分离法、间接磁分离法和微生物磁分离法。

3、磁分离技术在水处理中的研究与应用

3.1 处理富含磁性污染物的污水(直接磁分离法)

无论是开发成功的高梯度磁过滤器还是各种圆盘式磁分离器,在水处理方面,它们的首选应用领域都是钢铁废水的处理。钢铁热轧/ 连铸废水、冷轧乳化液等,其污染物98% 以上都是强磁性物质,另外还含有部分油类和少量非磁性物质,非常适合用磁分离的方式净化[5]。其工艺简单,占地面积小,处理效果好。

3.2 处理非磁性或弱磁性污染物废水水(间接磁分离法)

利用磁分离技术处理污水,其前提是污水中的颗粒需具有一定的磁性。对于非磁性或弱磁性污染物污水,一般通过投加磁种,然后利用絮凝技术使非磁性物质与磁种结合在一起,然后单独利用磁分离技术或絮凝沉降联合高梯度磁分离技术分离净化废水。这类技术被人们称为“磁种混凝磁分离”或者“磁加载磁分离”技术。

3.2.1餐饮废水

试验表明, 磁粉类磁种具有良好的除油性能, 通过投加经过磁化的磁种吸附污染物, 进行磁分离可以使水质净化。朱又春等[3]研究磁分离法处理含动植物油废水的原理和工艺条件时发现, 采用磁粉搅拌混合/磁分离工艺流程处理餐厅厨房含油废水,除污效果显著,且有较好的COD去除能力, 该技术有良好的实用性。

3.2.2含Ni2+电镀废水

孙水裕等[4]分两步进行了磁种凝聚/磁分离技术处理Ni2+电镀废水试验, 首先进行了磁种凝聚的试验, 研究了pH、磁种、聚丙烯酰胺对Ni(OH)2沉淀物与磁种凝聚成#磁性矾花?过程的影响。其次通过从废水中脱除磁性矾花的磁分离试验, 考察了磁场强度对磁分离过程的影响。试验结果表明, 经磁种凝聚/磁分离技术处理后, 废水中Ni2+的去除率达到99%以上, 出水Ni2+为0.42mg/L, 达到了相应的国家排放标准。Ni2+可以回收, 磁种经酸浸泡后可以循环再用。与其他方法相比, 采用磁种凝聚磁分离技术处理含Ni2+电镀废水具有处理时间短、处理量大、占地面积小的优点。

3.2.3 印染废水

印染废水成分复杂, 存在着大量水溶性污染物, 直接投加磁种和混凝剂进行磁种混凝难以使污染物与磁种形成含磁絮体, 为此, 首先必须通过适当的技术手段改变印染废水中水溶性污染物的溶解特性, 使其通过磁种混凝获得磁性,实现磁分离。

3.3 磁分离技术与生化技术的结合应用(微生物磁分离法)

为了更好地处理污水中的COD、BOD、氨氮、磷等污染物,只有将磁分离技术与现有的生物处理技术相结合,才可能达到比较好的效果。

3.3.1 BioMag工艺

将CoMagTM 工艺与活性污泥法结合,可以达到脱氮除磷的效果。该工艺的实质为生物处理加上加药化学除磷。除磷主要靠化学沉析及混凝磁分离来实现。

3.3.2 生物流化床

HulyaYavuz等在生物流化床中引入磁场, 以磁性聚苯乙烯颗粒作为微生物载体, 使污水处理效率得到大幅提高。

4、磁分离技术在水处理中的应用前景

磁场的引入使混凝工艺的分离速度较常用的斜管沉降法提高l0~50 倍,可极大地提高水处理速度和减少占地,易于实现自动化控制及小型集成化设备,在给排水及废水处理等领域均有诱人的发展前途。

尽管如此,磁分离技术处理废水存在如下的技术难度和局限性:①大型磁场系统的研制、工程规模的形成及面向各种废水的普适性方面均存在诸多困难,如接磁种的方法、磁种的选择及磁种回收工艺需要研究改进,其理论亦有待发展和完善。以氧化铁处理浮油为例[15],吸附于氧化铁表面的浮油,可经由加热至300~350℃回收氧化铁,但由于氧化铁再加热的过程中其表面积及磁化率均会减低,故其后续处理能力亦有所下降;②介质的剩磁使得磁分离设备在系统反冲洗时, 难以把被聚磁介质所吸附的磁性颗粒冲洗干净, 因而影响着下一周期的工作效率;③为了提高磁场梯度, 必须选择高磁饱和度的聚磁介质,对聚磁介质的选择具有一定的技术困难, 且增加运行的费用。尽管磁分离技术是一种简易可行且处理效率高的水处理技术, 由于上述技术难度和局限性, 有待继续研究克服。

参考文献:

[1]郑必胜, 郭祀远, 李琳, 等. 磁分离技术处理食品发酵工业废水. 食品与发酵工业, 1999,25(01)

[2]B.N.克拉辛( 苏).水系统的磁处理[M]. 北京: 宇航出版社, 1988

梯度下降法的基本原理范文第3篇

[关键词]神经网络 多层感知器 层位标定 地震属性 油气预测

中图分类号:TE328 文献标识码:A 文章编号:1009-914X(2016)03-0025-01

1.人工神经网络的基本原理

目前人工神经网络有四十种左右,结构、性能各不相同,但无论差异如何,它们都是由大量简单的基本处理单元广泛连接而成的。这种基本处理单元称为神经元,也称为节点,它是生物神经元的模拟物。最简单的节点是所有输入的加权和,并通过一个非线性函数输出结果

决定一个神经网络性质的要素有三个,即神经元特性、网络结构、训练方法(或叫学习方法)。所谓训练方法是指网络作什么方法适应或学习自动地形成网络中各个节点之间相互连接的权系数及各个节点的阀值。由于这三个要素的不同形成了丰富多彩的各种网络。在该项目的研究中,使用的神经网络是多层感知器(Multilayer Perceptron)。

2.多层感知器

多层感知器是一种层状结构有前馈神经网络,它由输入层,输出层,一个或多个隐蔽层(hidden layer)组成,隐蔽层也称为中间层,每个节点只与邻层节点相连接,同一层间的节点不相连。一个三层感知器可产生任意复杂的判定区,多层感知器使用的激活函数是S型函数。按训练方法多层感知器属于监督学习型,训练方法多采用误差反传播算法,简称BP算法。

3.误差反传播算法

函数(costfunction)最小化,估价函数等于期望输出与网络实际输出差的平方和。只有对应当前输出所属类的那个输出节点的期望输出是1.0,其余所有输出节点期望输出是0.0。网络训练时,开始取一些小的随机数(计算机自动生成),以这些随机数作为网络内部各个节点之间连接的权系数和各个节点上的阈值的初始值,然后,输入所有训练样本数据,根据网络求得输出结果,计算实际输出与期望输出的差值,并按照一定的规则,不断地修改节点间的连接权系数和节点内部的阈值,反复这一过程,直至权值收敛,并使估价函数降至可接收值。研究指出,真正的梯度下降法要求采取无穷小步长,权值改变的比例常数是学习率,学习率越大,权值改变量越大,网络收敛速度越快,但学习率大会产生震荡。为了增大学习率而不导致振荡,可增加一个冲量项(momentum term)。

4.神经网络油气预测

本次研究对三维地震资料进行了层位标定和构造解释,在构造解释的基础上分别提取地震属性,按其XY坐标重新进行网格化,将所提地震属性合并为一个整体。

该工区面积为1272平方千米,测线号1977-4639,共2664线,样点数为1905242点。预测层位为孔二段(EK2)。根据所选样本射孔井段深度及其试油结论,落实该段的含油气井和干井。统计结果表明:

在EK2内选择45口 (g107x1、g108、g143、g146x1、g2209、g61、g63、g68、g87、g89、g95、g996、g998、g999、n18、n20、n21、n22x1、n24、n59、n63、n69、n70、n73、n89、n91、wu7、y23、z19、z23、z25、z28、z31、z32、z34、z45、z46、z48、z49、z50、z52、z87、z88、z89、zx58)含油气井;

应用神经网络进行油气预测,首先应用Landmark软件提取地震层位属性,其后的实现步骤为:

①将每个地震属性在工区范围内作归一化处理,在此基础上可获得每一个地震道对应的地震属性样本。

②根据试油结论、地质分层数据表、射孔井段、井口坐标和井斜数据制作各砂层组和各井在该砂层组内的含油气性数据表,以便生成供神经网络学习用的训练样本集。上述数据及地震解释层位数据的可靠性都将影响预测结果准确性。

③训练样本集构成的参考原则:选取部分井旁样本组成训练样本集,留一部分井作为检验井,考核预测结果的可靠性。具体做法是:以射孔井段处的井下坐标在地面上的投影为原点,在指定的搜索半径范围内和指定产油气井旁抽取若干个样本作为含油气样本子集;在产油气井周边选择部分无油气井、并在无油气井旁抽取若干个样本作为无油气样本子集;将这两个样本子集合并在一起,便生成了训练样本集。

④将训练样本集提交给神经网络,让神经网络学会有油气和无油气的分类方法,即计算神经网络节点间的权系数。

⑤对工区内逐个样本进行分类,从而得到油气预测平面分布图。

EK2训练样本集是由含油气样本和干样本两个子集构成,从45口产油气井旁各抽取1-2个样本(其中g998、n20、n70抽取了两个样本),组成48个含油气样本,又从c14、g129、z37等22口干井旁各抽取1-4个样本(其中c14、g136、g137、g139、g157、g158、g194、jia6、x6、x7、y11抽取了2个样本,g128、g9、g990、wu15、z37抽取了3个样本,wucan1抽取了4个样本)组成48个干井样本,该层训练样本集的样本总数为含油气样本和干样本之和(96)。生成的训练样本集供神经网学习,“学习成绩”可以用不在训练样本集中井的含油气性来评判,即EK2的训练样本集共用67口井,用余下123口井(其中35口井为含油气井,其余88口井为干井)的含油气性来评价预测结果的可靠性。得到了EK2的油气预测图及顶面构造(等值线)与该层的油气预测叠合图。训练样本集选用了45口含油气井和22口干井,其余123口井作为验证井,EK2油气预测成果图(图7-9)显示,除了少数油气井(如g120、w38)在油气预测含油气边界处外,其余33口井均得到很好的验证,表明预测结果具有较高的符合程度(即符合度为33/35*100%=94%)。

5.结论

本次研究对三维地震资料进行了层位标定和构造解释,神经网络对工区内逐个样本进行分类,从而得到油气预测平面分布图。从分析结果看出,EK2含油气的地方,其预测值大部分都落在0.5至1的范围内,油气预测成果图展示了含油气区域的有利范围。从此次研究上看来利用神经网络预测油气是可行的。

参考文献

[1] 林畅松,李思田,任建业,断陷湖盆层序地层研究和计算机模拟――以二连盆地乌里雅斯太断陷为例,地学前缘,1995,2(3):124-132

梯度下降法的基本原理范文第4篇

关键词:贫困生;认定模型;灰色系统;BP神经网络

高校贫困生的认定是国家助学工作的首要环节,其准确性直接影响到该工作的效益和效率。目前,由于高校大多是以生源地―辅导员―班级为主线的主观评定程序,这难免存在不稳定因素。因此制订科学合理的贫困生认定方法,以保证国家助学工作的公平、公正,是我国高校的当务之急。

一、贫困生认定现状

1.贫困生认定材料的随意性

针对要申请励志奖学金、助学金以及助学贷款的学生,学校会要求其提供由户口所在地政府部门和民政部门出具的贫困证明,以此作为衡量学生是否贫困及其贫困等级的重要依据之一。然而,部分地区的贫困证明却缺乏必要的监督与约束机制,从而缺乏一定的可信性。一方面,开具贫困证明的部门并没有对贫困家庭走访调查,没有真正地深入了解学生的家庭实际情况。另一方面,有关部门碍于乡情、人情,也就随意地开具了贫困证明,这就使得贫困证明的可信度降低。

2.贫困生认定过程的主观性

高校根据学生贫困证明以及申请表了解其家庭情况,但是学生家庭收支数额、家庭医药费用等都缺乏相关证明,因此这使得贫困生认定过程具有一定的主观性。另外由于高校大多采用比较民主的方法,即投票选举法,认为同学之间通过平时消费支出水平能了解更为真实的情况,但这种看似民主的方法,却为同学间拉帮结派制造了机会。部分同学商量好相互投票,通常当出现票数相同情况,辅导员会将助学金平分给这几位同学;或者当他们集中投票给某一位同学,而这位同学最终获得贫困资助将宴请各位同学;还有一些同学为了减轻家庭经济负担,就提供虚假信息,怎么样能评上助学金就怎么说。因此客观数据的缺乏,贫困生认定过程中所呈现出的主观性,使得贫困生等级无法获得正确的判断。

3.贫困生认定方法的局限性

高校贫困生确认的贫困线一般按以下公式计算:PL=X/2。其中PL表示贫困线,X表示大学生的平均消费水平(大学生用于大学生活、学习有关消费的平均值)[1],若低于贫困线,则认为该同学为贫困生,但是每个地区的生活消费水平不一样,这也就使得该方法可行性降低。赵元等对高校贫困生认定采用层次分析法,该方法将复杂的问题简单化,且将其合理运用使得贫困生的贫困程度判定更加贴近真实性[2],但是层次分析法涉及高等数学理论,这就局限了运用者的范围;胡磊引入灰色聚类评估,将三角白化权函数灰色评估应用于对高校贫困生的贫困程度认定,将人的主观判断用指标的形式表达和处理,定量与定性分析相结合[3],但是该传统的三角白化权函数以及贫困生认定综合指标的选取还有待进一步修正。

二、基本理论

1.灰色系统基本理论[4]

灰色系统理论以“部分信息已知、部分信息未知”的“小样本”“贫信息”不确定性系统为研究对象,主要通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。在现实生活中,常常存在只知道取值范围而不知道确切值得数,这样的数被称为灰数。其中既有下界又有上界的灰数称为区间灰数,比如:某家庭人均月收入2000~2500元,可记为1∈[2000,2500]。

设灰数∈[a,a](a<a),在缺乏灰数取值分布信息的情况下:

①若为连续灰数,则称^=12(a+a)为灰数的核;

② 若为离散灰数,ai∈[a,a](i=1,2,…,n)为灰数的所有可能取值,则称

^=1n∑ni=1ai为灰数的核。

2.BP神经网络基本理论[5]

人工神经网络是由神经元组成的一

种非线性映射方法,它能够从已有数据中自动地归纳规则,获得这些数据的内在规律。其中BP神经网络是人工神经网络中最

为简单可行的,计算量较小的,具有并行能力的模型,其基本原理是采用梯度下降法调整权值和阈值,使得网络的实际输出值和期望输出值的误差最小。BP神经网络主要包括三层:输入层、隐含层和输出层。而隐含层节点数的确定非常重要。所以,由经验公式,可以确定最佳隐含层的节点数:l=2m+1,其中l为隐含层节点数,m为输入层节点数。常用的激活函数是S型函数,即 Sigmoid函数,其值域为[0,1]。所以需要将输入数据和导师训练值都事先进行归一化处理,而最后将预估结果进行反归一化处理,得出所需要的数据。

三、贫困生认定的指标体系和模型

1.认定指标的选取

高校贫困生是指学生本人及其家庭所能筹集到的资金,难以支付其在校期间的学习和生活基本费用的学生。高校贫困生的认定受社会、学校、家庭、消费等诸多方面因素的影响。根据抽样调查研究结果,并参考专家建议,遵循客观事实,最终确定了以下八个指标:家庭人均月收入,家庭月医疗费用,家庭负债总值,社会资助金额,月平均生活费,娱乐等消费水平,勤工助学月收入,学习成绩水平。

2.基于灰色系统的BP神经网络模型

灰色系统理论与BP神经网络模型具有很强的优势互补性,通过灰色系统理论可以有效地处理信息不完备或是信息不确定的情况,同时BP神经网络又能处理复杂的非线性映射问题,模拟人类尚未完全认识的知识领域。基于此,本文构造了一种基于灰色BP神经网络的高校贫困生认定模型,具体步骤如下:

①分析高校贫困生的认定指标,采集样本数据,并对区间灰数的指标运用灰色系统理论知识,将区间灰数转换成实数。

②在Matlab环境下,将指标实数进行归一化处理。

③设计BP神经网络对输入值进行训练,采用动量梯度下降法进行修正各层的权值和阀值。

④计算输出层误差,若误差不符合设定值,则返回步骤③,继续训练;反之,则直接显示输出值,最后将数据进行反归一化处理。

本文提出了一种科学合理的高校贫困生认定模型,即基于灰色BP神经网络的高校贫困生认定模型。该模型具有普遍适用性,有效解决了高校贫困生认定难的问题,也为认定工作提供了新的思路。

参考文献:

[1]张剑峰, 罗浪, 赵燕,等.高校贫困生的界定[J]. 江西教育研究, 2005 (05): 39―41.

[2]赵元, 罗世超.层次分析法在高校贫困生认定中的方法和运用探析[J]. 学理论, 2013 (18): 335―336.

[3]胡磊.基于三角白化权函数灰色评估在高校贫困生认定中的应用[J]. 数学的实践与认识, 2013, 43(16): 79―83.

[4]刘思峰, 党耀国, 方志耕, 等. 灰色系统理论及其应用[M]. 北京: 科学出版社, 2010.

[5]王莹莹.基于灰色神经网络模型的煤炭物流需求预测研究[D].北京: 北京交通大学, 2012.

基金项目:西华师范大学大学生科技创新活动项目“基于灰色BP神经网络的高校贫困生认定模型”[项目编号:42714082]。

作者简介:

龙钊(1989―),女,四川自贡人,硕士研究生,研究方向:灰色系统理论;

梯度下降法的基本原理范文第5篇

关键词:贵金属价格预测;神经网络;马尔科夫模型;偏最小二乘分析

中图分类号:TF83 文献识别码:A 文章编号:1001-828X(2016)012-000-04

一、模型一:马尔科夫模型

1.马尔科夫模型基本介绍

马尔科夫预测模型的构建,即利用初始状态的概率向量和状态转移矩阵来推测预测对象未来某一时间所处的状态。S(k)=S(k-1)・ P=S(0)・Pk,其中,P为一步转移概率矩阵。由模型可知,第K期的状态概率取决于初始状态概率和一步转移概率矩阵的K次方。由此可见,若已知初始状态概率向量S(0)及转移矩阵P,则可求出预测对象在任一时间处于任一状态的概率。

2.马尔科夫模型的约束性[1]

运用马尔科夫预测模型对预测对象在预测期间的约束条件为:

(1)每一个时期向下一个时期的转移概率不变,均为一步转移概率;

(2)预测期间状态的个数不变;

(3)无后效性,即状态的转移仅与它前一期的状态和取值有关,而与前一期以前所处的状态和取值无关。符合上述约束条件的预测对象即构成马尔科夫过程,我们可对其建立预测模型进行预测。

但值得注意的是,由于长期来看转移概率矩阵将发生变化,马尔科夫预测法只适合于短期预测。在短期内,如果贵金属市场无特殊事件发生,运行正常,那么贵金属价格的变化过程可看作一个动态的随机过程,满足马尔科夫过程的条件,可以运用马尔科夫预测法进行价格的预测。

3.模型的建立与求解

步骤如下:

①根据历史数据推算贵金属价格的转移率,算出转移率的转移矩阵;

②统计作为初始时刻点的贵金属价格分布状况;

③建立马尔科夫模型,预测未来贵金属价格供给状况。

本文选取2015年6月-2016年2月共183个交易日的收盘价变动情况为例,将黄金价格的增长率划分为5种状态:快速增长(价格增长超过0.05%)、缓慢增长、相对不变、缓慢下降、快速下降(价格下跌超过0.05%),分别记为状态1、2、3、4、5。

由程序运行结果知:出现各种状态的次数矩阵如下:

又因为最后一个交易日的大盘状态为4,所以预测下一个交易日黄金价格处于状态1、2、3、4、5的概率矩阵为[0 0.5278 0.0694 0.3889 0.0139],即下一个交易日黄金价格缓慢增长的可能性最大,概率为52.78%。进而求出两补状态转移矩阵如下:

预测下一个交易日黄金价格处于状态1、2、3、4、5的概率矩阵为[0.0057 0.4997 0.0710 0.4078 0.0158],即再下一个交易日黄金价格仍然是缓慢增长的可能性最大,概率为49.97%。但是可以看出价格处于四种状态的概率越来越接近,预测结果越来越不明显,所以表明马尔科夫模型只适用于做短期预测。

由求解结果与实际金价对比可知,运用马尔科夫方法构建的预测模型对贵金属价格的预测显示出一定的成功率。当然,也应该指出这种概率预测方法得出的结果只是表明了预测对象将来将以某一概率趋向于某种状态,而不是绝对处于这种状态,也并不能完全得到贵金属价格的具体数值。由于贵金属市场的波动是一个复杂的非线性系统,贵金属价格的变化受到了多种因素的影响,因而包括马尔科夫预测法在内的任何一种预测方法都不可能准确地预测出贵金属价格每日的变化。虽然运用马尔科夫预测法对金价作短期预测只能取得一定的效果,但其新的预测思路也颇具借鉴意义。

二、模型二:人工神经网络

1.神经网络模型基本介绍

人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。BP神经网络是训练方式为误差反向传播,激励函数为S-sigmoid函数,即为:f(x)=1/(1+exp(-x))。BP网络模型处理信息的基本原理是:输入信号通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号,网络训练的每个样本包括输入向量和期望输出量,网络输出值与期望输出值之间的偏差,通过调整输入节点与隐层节点的联接强度取值和隐层节点与输出节点之间的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。

BP网络模型包括其输入输出模型、作用函数模型、误差计算模型和自学习模型[2]。

节点输出模型

f-非线形作用函数;q-神经单元阈值;

作用函数模型

误差计算模型

误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数,本文所采取的是残差计算方式:

其中,表示 i节点的期望输出值;表示i节点计算输出值。

学习(权值更正)模型

神经网络的学习过程,即连接下层节点和上层节点之间的权重拒阵的设定和误差修正过程。BP网络有导师学习方式-需要设定期望值和无导师学习方式-只需输入模式之分。自学习模型

表示学习因子;表示输出节点i的计算误差;表示输出节点j的计算输出;表示动量因子。

过程神经网络与一般的人工神经网络最大的不同在于,某一时刻的系统输入量不止是当前时刻的输入量,而且还包含之前某段时间的输入量,输入层节点用于接受时变的输入函数,个时变输入函数的空间加权聚合、时间累积聚合以及激励运算,并将运算结果输出至输出层;输出层也不仅接受来自隐层神经元的激励计算结果,而且直接接受来自输入层的时变输入函数信号,并将接受到的信号在进行完空间加权聚合及时间累积聚合的运算后完成系统的激励输出。

2.过程BP神经网络的模型建立

由于黄金价格的自身时间序列预测,是根据之前某段时间的价格预测之后某个时间点的价格,基于这一点思想,建立了过程BP神经网络,由于对输入量时间维度的阶数最优性的不确定,本文分别构建了1-12阶的过程神经网络,即当前系统的输入量分别为之前1-12个时刻的输入值(黄金价格),以此来构建1-12阶的过程神经网络。分别比较得到的12个神经网络的实际输出与预期输出的关系,选取其中误差最小的阶数,作为最优过程神经网络的阶数。

同时对于划分好的输入量,输出量,选取其中的百分之九十进行学习,并用剩余的百分之十进行检验,即可以防止学习不足,数据信息提取不完善,又可以做到防止过拟合,过度依赖于原数据而失去了对其他数据的处理能力。

输入量和相应输出量数据提取。在进行第阶的过程神经网络的构造时,输入量的组数为 [N/k](其中N为总黄金价格日数据的个数),其中第组输入量为,输出量分别为。

输入量和相应输出量的归一化处理。由于数据差异性基本都在同一数量级,为了神经网络的权值不会特别受输入量,本文所采取的归一化方式为把最小值归一化为0,把最大值归一化为1,归一化公式如下:

神经网络基本结构的创建。过程BP神经网络的结构选取为,输入神经元个数等于阶数,共含有两个隐含层,每个隐含层含有五个神经元,输出神经元个数为1,基本结构如下:

神经网络的学习过程。神经网络的学习过程按照梯度下降法进行,以11阶输入为例,学习过程的相关图像如下。

随着迭代次数的残差变化情况如下:

神经网络的相关参数值的变化示意图如下:

神经网络训练45代之后,训练数据、测试数据、检验数据和全部数据分别与实际数据的相关性程度示意图如下:

利用学习的结果进行预测,并根据误差计算公式,计算分析每一阶数的预测效果。

3.模型的求解

模型求解得到阶数1-12的预测误差如下:

在此给出具有代表性的两幅预测图像:

(即综合误差最大的2阶图像、综合误差最小的10阶图像)

最优阶数所对应的神经网络的训练结果如下:

三、模型三:偏最小二乘法

1.偏最小二乘法基本介绍[3]

偏最小二乘法的基本公式为:

偏最小二乘回归≈主成分分析+典型相关分析+ 多元线性回归分析[4]

偏最小二乘法的基础是最小二乘法,在尽可能提取包含自变量更多信息的成分的基础上,保证了提取成分和因变量的最大相关性,即偏爱与因变量有关的部分,所以称其为偏最小二乘回归。

2.模型的建立与求解

模拟黄金价格与各因素之间的关系,变为构造一个变量与自变量之间的函数关系。通过主成分分析的方法,在自变量中提取主要成分,在因变量中提取主要成分,并且让(通过典型相关分析实现),然后进行因变量,若精度满足要求,即在本文中要求交叉有效性小于0.0985,则停止进行下一个主成分的选取。否则再继续选取第二主成分,然后进行,直到满足精度的要求。当构建完成,再得到因变量与自变量偏最小二乘方程[5]。

经Matlab程序运行后得到交叉有效性-0.1723以及主成分的系数矩阵,进而得到因变量与自变量之间的偏最小二乘回归方程:

易知三种方法的精确程度:神经网络>偏最小二乘分析>马尔科夫模型。马尔科夫模型精度最低,我们仅用该模型通过黄金价格的数据预测其变化趋势及大致浮动范围,无法加入相关因素的扰动进行分析与预测。神经网络是模拟生物神经系统对真实世界物体所作出的交互反应,因此其预测数据的拟合度最高。偏最小二乘分析法则是通过纯数理方法进行预测,相对神经网络缺少交互性。

参考文献:

[1]李海涛.运用马尔科夫预测法预测股票价格[J].统计与决策,2002(5).

[2]张立明.人工神经网络的模型及其应用[M].上海:复旦大学出版,1993.

[3]高惠璇,著.应用多元统计分析[M].北京:北京大学出版社,2005,1.

梯度下降法的基本原理范文第6篇

关键词:神经网络 特征提取 模式识别

中图分类号:U495 文献标识码:A 文章编号:1674-098X(2017)01(a)-0115-05

随着通信技术的飞速发展,出现了适用于不同背景环境的通信标准,每种标准都有其特定的调制方式和工作频段,为了满足人们实现不同标准间互通的需求,软件无线电技术应运而生。它利用可升级、可替代的软件来完成尽可能多的通信功能硬件模块,将多种类型的信号处理基于一体。为了能够处理不同类型的调制信号,必须首先识别出信号的调制类型,然后才能进行下一步处理。因此,调制信号的自动识别技术,就成了软件无线电技术中的关键。

神经网络具有的信息分布式存储、大规模自适应并行处理和高度的容错性等特点,是用于模式识别的基础。特别是其学习能力和容错性对不确定性模式R别具有独到之处。其中BP网络长期以来一直是神经网络分类器的热点,由于它理论发展成熟,网络结构清晰,因此得到了广泛应用。基于A.K. Nandi和E.E. Azzouz从瞬时频率、瞬时幅度和瞬时相位中提取的特征参数,我们就可以用神经网络对常用的数字调制信号进行自动分类。

1 神经网络

根据T. Koholen的定义:“人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体做出交互反应。”人工神经网络是在现代神经学研究成果的基础上发展起来的模仿人脑信息处理机制的网络系统,它由大量简单的人工神经元广泛连接而成,反映了人脑功能的若干特性,可以完成学习、记忆、识别和推理等功能。

2 数字调制信号特征参数的提取

计算机处理的信号都是对调制信号采样后的采样信号序列,因此设采样序列为(n=0,1,2,…,Ns),采样频率为。对采样序列进行希尔伯特变换,得如下解析表达式:

(1)

采样序列的瞬时幅度:

(2)

瞬时相位:

(3)

由于是按模计算相位序列,当相位的真值超过,按模计算相位序列就会造成相位卷叠。载波频率引起的线性相位分量,是造成相位卷叠的主要因素。因此,必须对进行去相位卷叠。去相位卷叠后的相位序列为,再对进行去线性相位运算,得到真正相位序列。瞬时频率为:

(4)

在上述基础上,提取下面5个特征参数。

(1)是被截取信号片段的零中心归一化瞬时幅度的谱密度的最大值,定义为:

(5)

其中为零中心归一化瞬时幅度在t=i/fs(i=1,2,…,Ns)时刻的值;为采样速率;为每一个信号样本采样点的样本个数。定义如下:

-1 (6)

其中:

, (7)

(2)为非弱信号段中瞬时相位非线性分量的绝对值的标准偏差,定义如下:

(8)

其中为经过零中心化处理后瞬时相位的非线性分量在时刻的值;为判断弱信号段的一个幅度判决门限电平,在门限以下信号对噪声非常敏感,这里取;C为全部取样数据中大于判决门限的样本数据的个数。

(3)为非弱信号段中瞬时相位非线性分量的标准偏差,定义如下:

(9)

(4)为零中心归一化非弱信号段瞬时幅度绝对值的标准偏差,定义如下:

(10)

(5)为零中心归一化非弱信号段瞬时频率绝对值的标准偏差,定义如下:

(11)

其中,,,,rs为数字序列的符号速率。

3 基于BP网络的数字调制信号的自动识别

把BP网络应用于数字调制信号的自动识别,是应用了其简单的结构和非线性映射的本质。将特征参数映射成与其对应的调制信号,是此方法的基本思路。

3.1 调制信号识别的基本原理

由上述得到的5个特征参数区分多种数字调制信号的原理,可用图1简单示意。

用于区分是否包含幅度信息的信号;用于区分是否包含绝对相位信息的信号;用于区分是否包含直接相位信息的信号;用于区分是否包含绝对幅度信息的信号;用于区分是否包含绝对频率信息的信号。

3.2 BP网络

BP网络结构上是一个多层感知器,其基本算法是反向传播算法,反向传播(BP)算法是一种有师学习算法,BP算法的学习过程由正向传播和反向传播两部分组成,在正向传播过程中,输入向量从输入层经过隐含层神经元的处理后,传向输出层,每一层神经元的状态只影响下一层神经元状态。如果在输出层得不到期望输出,则转入反向传播,此时误差信号从输出层向输入层传播并沿途调整各层间连接权值和阈值,以使误差不断减小,直到达到精度要求。

标准的BP算法如下(以单隐层结构为例)。

W和b分别为输入层与隐层神经元之间的权值和阈值;x为输入层的输入;u和v分别为隐层的输入和输出;为输出层的输入;为隐层与输出层之间的权值;y为网络的实际输出;d为网络的期望输出;e为误差。

(1)正向传播过程。

输入层:特征参数向量组x为网络的输入。

隐含层:其输入值u为输入层的加权和(当网络为单隐层时)。

(12)

输出为:

(13)

式中为神经元的激励函数,通常为Sigmoid函数。

(14)

输出层:输出层神经元的激励函数通常为线性函数,所以输出值为输入值的加权和。

(15)

由y和d求出误差e。若e满足要求或达到最大训练次数,则算法结束,网络完成训练,否则进入反向传播过程。

(2)反向传播过程。

首先定义误差函数:

(16)

BP学习算法采用梯度下降法调整权值,每次调整量为:

(17)

式中,η为学习率,0

①对于输出层与隐含层之间的权值修正量:

(18)

其中

②对于隐含层与输入层之间的权值修正量:

(19)

式中,则下一次迭代时:

(20)

(21)

(3)BP网络的设计。

由神经网络理论可知,具有至少一个带偏差的S形隐含层和一个带偏差的线性输出层的网络,能够逼近任意的有理函数。因此该设计采用3层网络结构。

①输入层:输入层神经元的个数就是输入向量的维数。

②隐含层:根据经验公式,隐含层神经元个数M与输入层神经元个数N大致有如下关系:M=2N+1,又考虑到计算精度的问题,因此隐层设计为5。一般说来,隐节点越多,计算精度越高,但是计算时间也会越长。

③输出层:一般说来输出层神经元的个数等于要识别的调制类型的个数,但是还要具体情况具体分析。

结合该次设计实际,网络采用1-5-2结构。

(4)神经网络方法实现自动调制识别的步骤。

在此将该文方法实现的步骤归纳如下。

①由接收到的调制信号求其采样序列,进而得到其复包络。

②由信号的复包络求其瞬时幅度,顺势相位和瞬时频率。

③由信号的瞬时参量求其5个特征参数。

④用信号的特征参数向量组训练网络。

⑤用训练好的网络对调制信号进行自动识别。

(5)MATLAB仿真。

为对用神经网络进行调制信号自动识别的方法进行性能验证,下面对2FSK和2PSK做MATLAB仿真试验:基带信号的码元速率为50 kHz,载波频率为150 kHz,采样速率为1 200 kHz,对于2FSK信号,载波之差为50 kHz。将网络调整到最佳状况,对网络进行了100次的仿真训练,随机抽取了一组数据的收敛均方误差曲线如图2所示。

对训练好的网络进行性能测试。仿真识别实验分别对2FSK和2PSK信号采用SNR=10 dB,15 dB,20 dB和∞ 4组数据进行。在对网络进行了100次仿真识别的基础上得到以下数据,见表1。

由表1可以看出,用标准BP算法训练出来的神经网络,对2PSK信号有着较理想的识别成功率,在信噪比等于10 dB的情况下,依然可以达到99.5%以上的识别成功率。而对2FSK信号的识别成功率就不尽如人意,虽然在信噪比等于20 dB的情况下可以完全识别信号,但在信噪比等于10 dB的情况下,识别率较低。

4 结语

基于神经网络的数字调制信号自动识别的研究虽然初见成果,但是整体上看,它未对更多的调制类型进行测试,而且对某些类型的调制信号识别的效果还不甚理想。在仿真试验中,不可避免地出现了收敛速度慢、存在局部极小值和概率极小的不收敛现象这3个BP网络本质上的缺陷。采用改进的BP算法或者其他神经网络可以改善网络性能和提高R别成功率。

神经网络用于调制识别方法的可行性已初见端倪,与其他方法相比,神经网络具有的信息分布式存储、大规模自适应并行处理和高度的容错性等特点,使其非常适合于调制识别,而且它简单有效,极易用软件或硬件实现,相信神经网络技术能够在软件无线电领域发挥它独特而重要的作用。

参考文献

[1] 黄春琳,邱玲,沈振康.数字调制信号的神经网络识别方法[J].国防科技大学学报,1999(2):58-61.

[2] 吴惠.数字信号调制方式识别技术研究[D].兰州交通大学,2014.

[3] 飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].电子工业出版社,2005:44-58.

[4] 兰雪梅,朱健,董德存.BP网络的MATLAB实现[J].微型电脑应用,2003(1):6-8.

[5] 姚亚峰,黄载禄.通信信号调制识别技术[J].通信技术,2003(6):43-45,52.

[6] 姜莉.利用神经网络实现调制信号的自动识别[J].电子测试,2014(7):71-73.

[7] 从爽.神经网络、模糊系统及其在运动控制中的应用[M].中国科学技术大学出版社,2002:17-31.

[8] 高隽.人工神经网络原理及其仿真实例[M].机械工业出版社,2003:44-53.

[9] 飞思科技产品研发中心.MATLAB 6.5辅助神经网络分析与设计[M].电子工业出版社,2003:64-69.

[10] 李峻.基于决策理论的软件无线电信号调制样式自动识别[J].大连铁道学院学报,2002(4):50-54.

[11] 赵知劲,庄婵飞,干立.调制样式BP神经网络分类器[J].现代雷达,2003(10):22-24.

[12] 林华东,庞伟正.软件无线电中数字调制信号的自动识别[J].应用科技,2004(6):25-27.

[13] 王康利,谢建菲,赵兰华.基于神经网络的软件无线电信号的调制识别[J].计算机测量与控制,2004,12(9):877-878.

[14] 姜立芳,刘泊,施莲辉.一种改进的BP算法及其在模式识别中的应用[J].哈尔滨理工大学学报,2003(3):90-92.

梯度下降法的基本原理范文第7篇

关键词:岩质边坡; 神经网络

Abstract: using the basic principles of fuzzy mathematics, in Visual c + + language, and on the basis of the research and development of rock slope stability evaluation system of the BP model computer programs, and through the practical engineering analysis, forecast results and the practical perfectly, explain the BP neural network algorithm rock slope stability assessment is feasible, and can be used to guide practical, the calculation procedure is simple, easy to operate, has the certain application value.

Keywords: rock slope; Neural network

中图分类号:TP183文献标识码:A 文章编号:

在高速公路、基础工程、露天矿山、水利水电等工程中,边坡的稳定性非常重要。在边坡稳定性分析中。最基本的评价指标是极限平衡方程的求解。传统的方法是采用以安全系数为度量指标的定值法,这种做法虽经长期的实践证明是一种有效的工程实用方法,但在某些工程设计中按此法计算是安全的,实际运营却发生了破坏,其原因复杂多样:其中很重要的因素是从理论上忽略了计算参数的不确定性;另一方面边坡以多大程度保证安全,定值法不能明确地回答。因此近年来边坡随机可靠度分析理论与实践得到国内外岩土工程界广泛重视和迅速发展。这种方法与定值法的根本区别在于考虑了变量的随机性,并用严格的概率来度量边坡的安全度。

在诱发边坡失稳的因素中,地震荷载(包括人工爆破地震和天然地震)的作用最为敏感。考虑地震荷载作用的边坡可靠度分析。其安全系数通常需要叠代求解,建立的极限状态方程是基本变量的隐式函数,即不能表达为基本变量的显式函数。因此常规的边坡可靠度分析方法(FOSM法)将遇到很大困难。点估计法、有理多项式法、蒙特卡罗模拟和响应面法等是解决此类问题的常用方法。从这个意义来讲,“危险性”应是一个定量的概率.而上述方法给出的危险性评价结果只能是一种定性的描述。但是对于地震滑坡而言,由于涉及的影响因素很多,有些因素不易量化或很难获得.有些因素相互之间往往存在复杂的相关关系,因而很难用常规的数学模型加以度量,也很难将复杂的影响因素综合成一个元素进行评价。由此可见,地震滑坡危险性评价是一个十分复杂的系统问题。

本文提出基于神经网络的新的可靠度分析方法,并应用于地震荷载作用下的边坡可靠度分析。通过实际工程分析,预测结果与实际完全吻合,说明所采用的BP神经网络算法评价项目管理风险是正确的,可以用来指导实际。该计算程序简单,易操作,有一定的推广应用价值。

1BP神经网络技术简介

人工神经网络(Artificial p4eural Networks)是20世纪80年代以来获得迅速发展的非线形模拟技术,具有自组织、自适应、自学习和容错性等独特的优良性质,为多输入、多输出系统提供了有效的解决方案。人工神经网络特别适用于处理两类问题,一是复杂大系统的优化和求解,二是对内部未知系统的逼近和模拟。对于岩质边坡稳定性的智能化预测的研究属于第二种情况。根据连接方式不同,神经网络可分成两大类:没有反馈的前向网络和相互结合型网络。前向网络由输入层,中间层(隐层),输出层组成。隐层可以有若干层,每一层的神经元只接受前一层神经元的输出,这样就实现了从输入层结点的状态空间到输出层状态空间的非线性映射。在前向网络中,以误差反向传播网络(Back—Propagation)一BP网络的应用最为广泛。BP神经网络是一种多层前向网络,由输入层、隐含层(又称为中间层)和输出层组成。隐含层可以是一层也可以是多层。目前应用最广泛的是三层神经网络,即输入层、一层隐含层和输出层组成的BP神经网络。其学习过程由向前传播和向后传播两部分组成(图1)。误差函数的求取是一个由输出层向输入层反向传播的递归过程。通过反复学习训练样本来修正权值。采用最速下降法使得权值沿着误差函数的负梯度方向变化,最后稳定于最小值。

2BP神经网络技术在边坡稳定性中的预测

2.1边坡稳定性的评价因素

地震滑坡危险性总体评价是一项十分复杂的工作,用经典的数学模型很难加以定量的概括和描述。造成这种情况的主要原因是:①涉及的因素众多,且各因素之间相互影响、相互制约;②有些因素属于定性指标,且概念模糊很难直接用于滑坡稳定性分级。模糊数学理论则是解决此类模糊问题的有效手段。如前所述,由于地震滑坡的危害t分严重,国内外的地学工作者对地震滑坡的运动方式、影响因素等进行了大量的研究。根据对已有成果的分析,影响地震滑坡的因素可归纳为边坡所处的地质背景、岩体结构类型、地层岩性组合、地形地貌条件以及边坡的水文地质条件等5个方面。基于地震滑坡现阶段的研究成果以及资料的收集和可操作性,本文选取岩性(坡体物质组成)、水系、地形(坡度)、场地地震烈度、断层等5项因素作为评价地震滑坡危险性的指标。此五类指标将作为BP神经网络技术的输人参数。

2.2边坡稳定性的评价标准

在对区域性地震滑坡稳定性的空间预测研究方面,一些学者在对地震滑坡影响因素进行统计分析的基础上。利用专家打分方法确定各影响因素的权重,最后通过对所有影响因子进行综合评价来划分区域的地震滑坡危险性等级;还有的学者通过对大量已发生滑坡的深入调查,用统计模型来研究各种影响因素(如地震动、地层、坡度等)对滑坡的影响程度,并把得到的认识应用于滑坡预测区划中。

在前人研究的基础上,结合实际工作的需要,本文对地震滑坡危险性进行3级评定:地震滑坡危险区、地震滑坡危险程度中等区、没有地震滑坡危险区。相应地,各个评价因素的指标也按3级划分。具体指标分级见表1。其相应的输出参数为[0,0,1]地震滑坡危险区(A类);[0,1,0]地震滑坡危险程度中等区(B类):[1,0,0]没有地震滑坡危险区(C类)。此三类边坡稳定性的评价指标作为BP神经网络的输出因素。

2.3实例分析

1976年.在云南省龙陵、潞西一带发生了7.3级和7.4级强烈地震,这两次强烈地震造成了严重的地表破坏,产生了大量的滑坡、崩塌。据统计,该次地震共引发32个规模较大的滑坡和滑坡群(零星的小滑坡),其中7个属于老滑坡复活。

本文研究范围为98.5°~99.0°E、24.2°~24.9°N,按照0.01°间隔最终将整个区域划分为3216个单元。应用Basic编程对每一单元进行水系、断层、岩性、坡度、地震烈度等影响因素提取,把每一个网格单元看作是一个待评价的对象。

2.4网络训练

对该地震地区进行网络分区,各个区进行BP神经网络预测,经过2 556次运算,网络区域趋于稳定,表2为该地区地震滑坡的评价结果表。

3总结

1)文中建立了岩质边坡稳定性系统评价的神经网络模型,并应用于实际。

2)该方法综合考虑了多种因素对岩质边坡稳定性评价的影响。避免了单因素对工岩质边坡稳定性进行评价所带来的偏差。