首页 > 范文大全 > 正文

拉开档次法稳定性分析及改进

开篇:润墨网以专业的文秘视角,为您筛选了一篇拉开档次法稳定性分析及改进范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:采用随机模拟仿真的方法分别从增添异常对象和极端样本两个方面对拉开档次法的稳定性进了分析,给出了相关结论。在此基础上,基于“因子分析”提出了拉开档次法的改进方法,算例部分的分析表明该方法因兼顺了同类数据之间的内部差异,能够削弱“异常值”对原始数据的干扰作用,从而进一步提升了方法的稳定性。最后,指出拉开档次法适用于评价指标数目较少的评价问题,而基于“因子分析”的改进方法则适合于数据数目较多且指标有相关关系的评价问题。

关键词:综合评价;拉开档次法;随机模拟;因子分析

中图分类号:C934

文章标识码:A

文章编号:1007-3221(2015)02-0155-08

引言

综合评价是指对被评价对象所进行的客观、公正、合理的全面评价,因具有操作过程透明、结果可再现等特征,被广泛应用于经济管理、工业工程及决策管理等众多领域,迄今已取得了丰硕的研究成果。按照评价信息集成过程中是否有人为因素的介入大致可将评价方法划分为主观、客观两类。主观评价方法在评价过程中体现了评价者的意愿;客观评价方法则完全依据数据本身做出评价。拉开档次法是一种体现被评价对象之间整体差异的客观评价方法,该方法的基本思路是选择指标权系数,使得各被评价对象之问的差异尽可能拉大。从几何角度来看,是将由m个评价指标构成的m维评价空间中的n个点(被评价对象)向某一维空间做投影,使得各点在此一维空间上的投影点最为分散,即分散程度最大。因具有“评价过程透明、评价结果无主观色彩”等优良特性,拉开档次法自提出以来已被广泛应用及拓展。

本文主要从随机模拟仿真的视角对拉开档次法的稳定性进行分析,并在此基础上,给出能够提升该方法稳定性的“改进方法”。本文的研究,可为拉开档次法的稳定性测度、对异常值的处理问题等提供参考及依据。

1 拉开档次法简介

设x1,X2,…,xm为极大型指标(即指标取值越大越好),取其线性函数

对于式(5),有如下结论:

定理1 若取w为H的最大特征值所对应的标准特征向量,式(5)取得最大值。

定理1的证明详见文献。

而同为差异驱动型综合评价方法的另一种方法――离差最大化方法,则从单个指标出发来考虑权重,即如果某个指标能使所有决策方案的属性值差异较大,该指标对方案决策与排序将起重要作用,应该给予较大的权系数,反之赋予较小的权系数。离差最大化方法是一种体现被评价对象之间局部差异的客观评价方法。

离差最大化方法与拉开档次法都是通过权重系数体现被评价对象之间的差异,都是通过构建规划模型、设置单位化约束条件求得最优化权重。而他们的本质不同在于:(1)离差最大化方法是比较指标之间的偏差,偏差越大该指标对应的权重系数越大;而拉开档次法则是先将权重系数与指标合成得到评价值,用评价值之间的大小差异体现被评价对象之间的最终差异,求解权重系数的原则是使最终评价值之间的差异尽可能的大;(2)离差最大化方法强调指标之间的离差,拉开档次法强调评价值之间的均方差,两者均考虑了全部的指标信息,但出发点不同。

本文主要对拉开档次法进行研究,关于最大离差法和拉开档次法对被评价对象差异程度的体现将另文进行比较分析。

2 稳定性分析

显然地,评价数据的变动必然会引起结论的变化,这里主要从数据变化的角度对拉开档次法的稳定性进行分析。具体而言,在原始数据中加入“极端样本(异常对象)”,然后用Spearman's等级相关系数衡量评价结论发生逆序的程度,通常该系数的取值区间为[-1,1],取值越靠近1,说明发生逆序程度越小,拉开档次法的稳定性越好;反之,则稳定性越差。

考虑到结果分析的充分性,这里选用随机模拟仿真的方法对拉开档次法进行大规模模拟实验,原始实验数据按照“正态分布”和“均匀分布”两种方式随机发生,极端样本从原始数据最小值(或最大值)方向按照一定规则随机发生(见步骤4)。具体的仿真步骤如下:

步骤1依据指定行(指标个数)列(被评价对象个数)随机发生原始评价数据矩阵;

步骤2按照“标准化处理法”对原始评价数据矩阵进行预处理;

步骤3运用拉开档次法求解指标权重,并进行评价数据集结,得到被评价对象的排序;

步骤4按照特定规则增添单个被评价对象(极端样本或异常对象)

注:①当增添异常对象(异常对象指标值整体变异)时,可按如下方式增添:min{xij}-t×a×σj(从最小值方向增添)或max{xij}+t×a×σj(从最大值方向增添),其中t为步长,取值为整数,a>0为变异系数,σj为第j个指标的样本标准差;②当增添极端样本(极端样本中仅有个别指标值变异,剩余指标取原始数据相应指标的最小值或最大值)时,可按如下方式增添:(从最小值方向增添)或(从最大值方向增添)。

步骤5 依拉开档次法重新计算权重系数及排序,用Spearman's等级相关系数记录评价结沦发生逆序的程度;

步骤6 设置循环终止条件,即“各指标在若干步(本文设置为200)后相关系数平均值增量的平均变动程度小于等于某给定的精度(这里没为0.0001)”。

依据上述方针步骤,可得到不同情况下的仿真结果如下所述,仿真过程中采取从最小值的方向增添极端样本或异常对象,变异系数a=0.2。

2.1 不同数目被评价对象中增添异常对象的仿真结果分析

(1)山图1中的(a)和(c)可以看出:

①无论原始数据服从正态分布还是均匀分布,随着异常对象变异程度的加剧(变异步长t取值的增大),Spearman's等级系数的平均取值逐渐减弱,最终稳定于0.5左右;

②被评价对象数目对Spearman's等级系数的平均取值影响不明显。

(2)由图1中的(b)和(d)可以看出:

①当异常对象变异程度较小时,被评价对象之间会发生“完全逆序”(相关系数取值为-1)的情形,但随着异常对象变异程度的加剧,逆序情形突然改变,相关系数最终稳定于[-0.1,-0.4]左右;

②随着原始数据中被评价对象个数的增加,Spearman's等级系数最小值的最终稳定取值也逐步增加,说明异常对象对原始数据的干扰程度随着被评价对象个数的增加而减弱;

③当原始数据服从均匀分布时,Spearman's等级系数最小值的取值不大于服从正态分布时的取值,但服从均匀分布时“完全逆序”突然得到改变所需的突变步长要略大些。

2.2不同数目被评价对象中增添极端样本的仿真结果分析

比较图2和图l,可以看出:

①无论是增添异常对象还是极端样本,Spearman's相关系数的平均取值变化趋势一致,当在增添极端样本时,Spearman's相关系数的平均取值稳定于0.6左右,稍大于增添异常样本的取值,说明随着数据变异程度的加剧(异常对象所有指标均变异,极端样本单指标变异)原始数据受到的干扰程度增加,但干扰力度不明显;

②增添极端样本,使得原始数据发生“完全逆序”,且随着极端样本变异程度的加剧,这种“逆序”的状态几乎没有改变,即Spearman's相关系数的最小值始终等于或接近于-1。

2.3不同数目指标下增添异常对象的仿真结果分析

比较图3和图1可知:

①被评价对象及指标个数对Spearman's等级相关系数变化趋势影响不大,即图l和图3中相应图形中曲线的基本走势一致;

②随着原始数据指标个数的增加,Spearman's等级相关系数的平均取值逐渐变小,说明原始数据指标数目越多,对拉开档次法稳定性的影响越大;

③不同指标数目下Spearman's等级相关系数最小值及平均值的稳定值小于不同被评价对象数目下Spearman's等级相关系数最小值及平均值,说明指标数目对拉开档次法稳定性的影响要高于被评价对象数目对其的影响。

2.4不同数目指标下增添极端样本的仿真结果分析

比较图3和图4可得到与比较图1和图2类似的结论(不再赘述),比较图4和图2可知:

①增添极端样本时,无论被评价对象及指标数目如何变动,对原始数据的干扰程度几乎没有影响;

②随着指标数目的增加,增添极端样本后Spearman's等级相关系数的平均取值稍微变小,但其最小值始终等于或接近于-1。

综上所述,可达到以下结论:

(1)被评价对象及指标数目对拉开档次法稳定性的总体变化趋势影响不明显,但相对而言,指标数目对拉开档次法的影响要略高于被评价对象数目对其的影响;

(2)无论增添异常对象还是极端样本,对拉开档次法稳定性的总体变化趋势影响不明显,但增添异常对象对其的影响力度要大于极端样本的影响力度,此外,数据原始分布(正态或均匀分布)对拉开档次法稳定性无明显影响;

(3)加入极端样本情况下,原始数据可能会发生“完全逆序”,且这种情形不会随着样本变异程度的加剧而得到改变。

3 基于“因子分析”的改进方法

基于以上分析,为降低异常数据对拉开档次法结果的影响,这里基于“因子分析”法提出了一种拉开档次法的改进模型,该模型可概括为3个步骤,即指标体系“因子化”、“虚拟准则”内“拉开档次”、“虚拟准则”赋权及结果合成。

3.1 指标体系“因子化”

指标体系的“因子化”过程完成指标体系的分类,即“虚拟准则”(这里将公共因子定义为虚拟准则,以区别于单纯的因子分析方法)的构造。

现有p个指标(变量)x1,x2,…,xp(假设已经过了一致化处理,均为正指标),其对应的原始数据矩阵X为:

其中,p(p≥3)为指标(变量)个数,n(n≥3)为被评价对象(样本)个数。

对原始数据矩阵X的各行进行标准化处理,为简便起见,仍记标准化后的指标值矩阵为x,相应的变量为Xl,X2,…,xp。

经过因子分析处理后(因子分析过程省略),有:

因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意思。如果应用A不能很好地对因子进行解释命名,则需要对A进行旋转,使得因子载荷的平方按列向0和1两极转化,为确保公共因子之间的不相关性,建议选用Varimax旋转。旋转后得到的因子载荷矩阵为B,即:

3.2 “虚拟准则”内“拉开档次”

按照旋转后因子载荷矩阵中各因子载荷的大小,可将p个指标划分至m个准则描述的结构空间内。基于此,将标准化后的指标值矩阵X经重新排列后得到X*,即:

其中,n为评价对象个数,k为第m个准则下的指标个数。表示第ι个准则空问中的第i个指标,为相应的n个指标值。

抽取x*中第ι个准则下的各指标值数据形成(设有g个指标,且g≥3),即:对于第ι个准则的综合评价函数:若将第个评价对象的g个标准观测值代人(8)式,有:将式(9)写成矩阵形式,有:

求解式(13),w为H最大特征值所对应的特征向量(经过归一化处理)。

3.3 “虚拟准则”赋权及结果合成

可将“因子”看成由数据本身构造出的准则,可选用相应的主观赋权法完成各准则权重系数的汁算设选用某主观赋权法(如G1法、AHP法等)得到虚拟准则F1,F2…,Fm相应的权重系数为,…,,这里假设m>2。需要说明的是,通过采用因子分析法对指标体系进行降维,得出几个公共因子(虚拟准则),较少的虚拟准则降低了主观赋权的难度(用于比较的准则越少,认为判断的准确性越强,结果也越准确)。

记虚拟准则评价值矩阵为F,则:

Fij(i=1,2,…,n;j=l,2,…,m)为第i个评价对象第j个准则的评价值。设第i个评价对象的总评价值为Fi,则:

4算例分析

按照均匀分布在[0,1]区间内随机生成由10个被评价对象20个评价指标构成的评价信息矩阵,见表l。采用极端样本方式增添1个被评价对象,增添的极端样本步长为t=20,变异系数为a=0.2。

(1)拉开档次法依据拉开档次法求得10个被评价对象的排序位如表2所示。

(2)基于“因子分析”的拉开档次法

依据基于“因子分析”的拉开档次法,找到6个虚拟准则,为简便起见,令6个虚拟准则取平均权,求得10个被评价对象的排序位如表3所示。

(3)结果分析

由表2中数据可求得10个被评价对象排序位的Spearman's等级相关系数为0.5878,由表3中数据求得10个被评价对象排序位的Spearman's等级相关系数为0.8424。可以看出,在该算例的评价信息下,基于“因子分析”的拉开档次法的稳定性相较于拉开档次法的稳定性明显提升,原因有:①通过因子分析,提升了同虚拟准则下指标数据的相关性,并在同准则内使用拉开档次法进一步细化了相关数据之间的内部差异;②对不同虚拟准则的再集结,能够兼顾相关数据之间的内部差异,避免了削弱了极端样本对整体数据的干扰作用,从而提升了基于“因子分析”拉开档次法的稳定性。

5 结束语

本文采用随机模拟仿真的方法对拉开档次法的稳定性进行了分析,并给出了相关结论。在此基础上,基于“因子分析”给出了一种关于拉开档次法的改进方法,该方法能够兼顾同类指标(具有较高相关性的指标数据)之间的内部差异,从而降低了“异常值”对原始数据产生的干扰作用,可进一步提升方法的稳定性。需要说明的是,在实际应用中,基于“因子分析”的拉开档次法尤其适用于评价指标数目较多且存在异常数据的评价问题。