首页 > 范文大全 > 正文

分析的向量机需水运用

开篇:润墨网以专业的文秘视角,为您筛选了一篇分析的向量机需水运用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

引言水资源是人类生存与发展必不可少的重要基础性资源,是支撑社会经济可持续发展的重要战略资源。随着人口的增加,社会经济的快速发展和城市化进程的加快,人类对水资源的需求逐渐提高,水资源供需矛盾日益加剧,所面临的水资源短缺问题日益严重,已成为制约我国经济、社会、环境协调可持续发展的重要因素。应对水资源短缺,有效地开发、利用、治理、配置、节约和保护有限的水资源,关键是科学地进行水资源规划与管理,而需水预测作为水资源规划与管理的重要基础内容就显得极其重要。因此,合理的需水预测对实现水资源的可持续利用和经济社会的可持续发展具有重要意义[1]。近年来,国内外许多学者对需水预测的理论和方法进行了大量深入的研究,水资源预测方法呈现多样化发展趋势[2]。目前常用的需水预测方法主要有时间序列法、回归分析法、定额法、灰色预测以及趋势分析法等。实际用水系统是一个由经济、社会、资源、环境组成的复杂大系统,涉及的影响因素众多,影响因子的选取直接影响需水预测结果的精度和模型求解的复杂性。影响因子选取过少,会影响预测结果的准确性;影响因子选取过多,会使计算较复杂,可能陷入局部优化问题,难以求得全局最优解[2]。另外,我国实际用水量数据时间序列较短,且可靠性低[3],用这些常规的预测方法很难保证预测精度。因此,针对这些问题,本文采用主成分分析与支持向量机相结合的方法进行需水预测。应用主成分分析法从众多影响因子中筛选与主成分相关性比较大的影响因子,并结合相关分析法剔除伪相关因子,选取需水量的主要影响因子;然后根据支持向量机能够解决小样本、非线性、高维数的特点,将选取的主要因子作为输入样本建立支持向量机需水预测模型。并以洛阳市为例进行需水预测,结果表明,该方法拟合效果较好,预测精度较高。

1研究方法

1.1需水量主要影响因子的主成分分析主成分分析法是利用降维思想,把多指标转化为少数几个综合指标的多元统计分析方法[4]。其基本思想是通过变量相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系[5]。进行主成分分析的具体方法见文献[2-5],简单分析过程为:(1)对需水量影响因子的原始数据进行标准化处理,以消除统计误差和量纲不同的影响。(2)建立标准化数据的相关系数矩阵。(3)计算相关矩阵的特征值和特征向量,并将特征值λ1,λ2,…,λn从大到小排序,同时求得对应的特征向量u1,u2,…,un。(4)计算贡献率和累计贡献率。经分析筛选累计贡献率达到95%以上的作为需水量影响因子的主成分。(5)计算主成分载荷。它表示主成分与变量之间的相关系数。经分析选择与各主成分相关性比较大的影响因子。

1.2支持向量机需水预测模型支持向量机[6-8]是根据统计学理论提出的一种新型机器学习技术,目前常用于回归分析。能够在对小样本学习的基础上对其他样本进行快速、准确的拟合预测,具有很好的泛化能力,能较好地解决小样本、非线性、高维数和局部极值等实际问题[3]。已知训练样本集{(xi,yi),i=1,2,…,n},其中xi为输入变量,yi为预测值,n为样本数。设回归函数f(x)=wφ(x)+b,根据结构风险最小化准则,回归分析问题就是求使下面风险最小的f(x):利用对偶原理、拉格朗日乘子法和核技术,上述优化问题的对偶形式转化为:式中:φ(x)为输入空间到高维空间的非线性映射;C为惩罚因子;ε为不敏感损失函数;k(xi,x)为核函数;ξi、ξi*为松弛变量;ai、ai*为拉格朗日乘子。

2实例应用

2.1研究区概况洛阳市地处河南省西部,黄河中游南岸。多年平均降水量为696.9mm,由南向北逐渐减少,年降水主要集中在7-9月,约占全年降水量的65%。全市多年平均水资源总量为28.097亿m3,人均占有量不足430m3,与全省人均占有量基本持平,约占全国人均水平的1/5,属于缺水地区。随着洛阳市现代化的推进,城市建设规模的迅速扩大,水资源供需矛盾日益紧张,对洛阳市社会经济发展的影响越来越显著。因此,准确预测洛阳市需水量,为水资源规划与管理提供可靠依据,具有重要意义。

2.2需水量主要影响因子水资源需求变化是社会、经济、科技、文化等诸多因素综合作用的结果,过程十分复杂[9],因此,根据收集到的资料,选取的影响因子主要有:工业总产值、轻工业、重工业、重轻比、全部工业增加值、电力行业产值、电力行业增加值、发电量、工业用水重复利用率、万元工业增加值用水量、工业废水达标排放量、工业废水排放量、农业总产值、农林牧渔业总产值、农林牧渔业增加值、耕地面积、农作物播种面积、农田有效灌溉面积、农田灌溉亩均用水量、粮食总产量、降水总量、年末总人口、非农业人口、城镇人口、人口自然增长率、城镇居民人均可支配收入、农村居民人均纯收入、职工年平均工资、人均GDP、GDP、城镇生活人均用水量、农村生活人均用水量、建成区面积、绿化覆盖面积、公共绿地面积。根据选择的1999-2010年序列资料为基础数据,首先对原始数据进行标准化处理,以消除统计误差和量纲差异的影响,然后应用SPSS软件对样本进行分析计算,得主成分特征值和贡献率矩阵见表1。由表1可以看出,前4个主成分的累积贡献率达到96.936%,表明这4个主成分基本上代表了原来所有影响因子96.936%的信息。一般情况下,主成分累计贡献率达到85%以上时,就可以反映相关因子的影响。因此,取前4个主成分代替原影响因子。然后,根据SPSS软件计算得出的主成分载荷,选择主成分载荷较大的影响因子,即选取与主成分相关性较大的影响因子,并依据影响因子的经济和物理等属性对其分类,采用相关分析法考虑同类影响因子之间的相关性,排除伪相关的存在[1]。因此,最终选择了9个主要影响因子,分别为全部工业增加值、工业用水重复利用率、农业总产值、农田有效灌溉面积、降水总量、城镇人口、人均GDP、农村生活用水量及建成区面积。洛阳市需水量主要影响因子及其主成分载荷见表2。

2.3支持向量机需水预测及结果分析根据上述选择的主要影响因子,以1999-2010年12年的序列资料为基础数据,并将其分割为3部分,以1999-2005年的数据为训练样本,建立模型;以2006-2008年的数据为实验样本,优化模型参数;以2009和2010年的数据为检验样本,检验所建模型的推广能力。建模前对所有数据进行归一化处理,以消除量纲和单位不同的影响;然后利用CMSVM2.0软件建模,首先选取核函数,本文取比较常用的径向基核函数K(x,xi)=exp(-gx-xi2),回归模型择优标准采用绝对差,模型中参数惩罚因子C、核函数参数g和损失系数ε通过试算确定,模型拟合和预测结果的评价标准采用平均相对误差。经过调参计算,最终得到的最优模型参数:C=100,g=1,ε=0.01,历史样本需水量实际值与预测值拟合结果见图1和表3。由图1可以看出,模型对历史样本需水量的拟合效果较好。另外,从表3所列数据可知,实际值与预测值相对误差绝对值均不超过6%,最大为5.56%,最小为0.07%,平均相对误差为-0.83%。由此可见,基于主成分分析的支持向量机需水预测模型,拟合精度较高,可以满足需水预测模型的要求。应用训练、实验好的支持向量机需水预测模型,预测检验样本2009年和2010年的需水量,结果见表4。由表4可知,2009年和2010年需水量实际值与预测值相对误差分别为0.057%和3.55%,平均相对误差为1.80%。结果表明,利用主成分分析法筛选出的需水量主要影响因子能够很好的反映洛阳市需水量特征,建立的支持向量机需水预测模型预测精度较高,实际值与预测值相对误差绝对值均不超过6%,具有较好的适用性。由于实际用水系统是一个复杂的大系统,涉及的影响因素众多,影响因子选取过少,会影响预测的精度,影响因子选取过多,会使计算复杂化,而主成分分析法能够考虑较多的影响因子,并从中选取具有代表性的、能够反映需水量特征的影响因子。另外,实际用水量数据时间序列较短,制约了传统需水预测方法的应用,而支持向量机可以很好的解决小样本问题。因此,本文采用主成分分析法和支持向量机相结合的方法进行需水预测,考虑因素较为全面,并能够解决小样本问题。

3结语

本文针对需水预测中影响因素较多、实际用水资料时间序列较短的问题,提出了主成分分析与支持向量机相结合的需水预测方法,首先采用主成分分析法筛选需水量的主要影响因子,然后将其作为输入样本,对支持向量机模型进行训练和检验,寻找最优模型,并将该方法应用于洛阳市需水预测。结果表明,该模型对历史样本数据拟合程度较好,预测精度较高,模拟和预测的需水量与实际需水量相对误差.绝对值均不超过6%。由此可见,基于主成分分析的支持向量机需水预测模型,对需水量影响因素考虑的比较全面,所选主要影响因子能够较好地反映需水量特征,较好的解决样本数据有限的预测问题,且模拟预测精度较高,具有较强的泛化能力,是一种较有效的需水预测方法。