首页 > 范文大全 > 正文

主成分分析与聚类分析在地区综合实力评价中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇主成分分析与聚类分析在地区综合实力评价中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】本文选取具有代表性的7类共17个指标作为我国31个省、市、自治区综合实力评价的原始指标,运用主成分分析得到综合评价函数,计算得到我国各省市的综合得分,并据此进行K均值聚类分析,将我国31个省、市、自治区划分为5个类型,根据聚类结果对其进行了简单评价。

【关键词】主成分分析 聚类分析 综合实力评价

一、主成分分析法

主成分分析也称主分量分析,由于多个变量之间往往存在着一定程度的相关性,人们希望通过线性组合的方式,从这些指标中尽可能快地提取信息。主成分分析旨在保证原始数据信息损失最小的前提下,通过线性变换对高维变量空间进行降维处理,以少数的综合变量取代原有的多维变量。由于主成分是通过正交变换得到的,因此各个主成分是互不相关的,且第一个主成分的方差最大,其余次之。

主成分分析能够从选定的指标体系中归纳出大部分信息,并且能够根据指标间的相对重要性进行客观加权,可以避免评价者的主观影响,因此主成分分析在综合评价中的应用越来越得到人们的重视。根据主成分分析法进行综合评价的步骤如下:将原始数据标准化并建立变量的相关系数矩阵R;求出R的特征根λ1≥…≥λp≥0相应地特征向量为T1,T2…Tp;由累计方差贡献率确定主成分的个数(m),并写出主成分为:Y=T'X(1);以特征根维权,构造综合评价函数Z。各个主成分的权重分别为wi=λt/ λi(i=1,2,…p)(2),Z=w1Y+w2Y+…+wPY=W'Y=W'T'X=(TW)'X=(3)。

二、聚类分析法

聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。本文采用聚类分析中的K均值聚类,以主成分分析得到的各地区的综合实力得分为聚类变量,以距离的远近亲疏为标准进行聚类,类数的确定参考系统聚类的结果。

三、综合实力指标的选取

影响一个地区综合实力的指标有很多,本文参考国内外相关文献资料,综合考虑各种因素的影响力和数据的可得性,选择了以下七个方面的十七项指标作为综合评价的指标。

(1)综合经济实力,主要包括:①地区生产总值(亿元);②全社会固定资产投资(亿元);③社会消费品零售总额(亿元)。

(2)产业结构优化情况,主要指标为第三产业产值比重。

(3)政府财政收支情况,主要包括:①地方财政收入(亿元);②地方财政支出(亿元)。

(4)人民收入消费情况,主要包括:①城镇居民可支配收入(元);②农村居民家庭人均纯收入(元);③居民消费水平(元)。

(5)城市概况,主要包括:①每万人拥有公用交通车辆(辆);②建成区绿化覆盖率。

(6)科、教、文、卫事业,主要包括:①技术市场成交额(万元);②文盲半文盲占15岁以上人口的比重;③人均拥有公共图书馆藏量(册);④每万人医疗卫生机构床位数(张)。

(7)对外经济贸易情况,主要包括:①外商投资总额(亿美元);②进出口总额(万美元)。

四、各地区综合实力得分及排序

从标准化的数据出发,通过R软件进行主成分分析得17个相互独立的主成分,各个主成分的方差贡献率分别为54.13%,20.28%,10.94%,5.74%,2.40%,1.83%,1.48%,0.93%,0.72%,0.62%,0.40%,0.27%,0.14%,0.05%,0.03%,0.01%,0.007%,根据公式(3),计算得综合评价函数为(其中Xi*为标准化后的变量):

Z=0.226X1*+0.195X2*+0.228X3*+0.026X4*+0.209X5*+0.205X6*+

0.12X7*+0.11X8*+0.092X9*+0.056X10*+0.056X11*-0.027X12*-0.011X13*+0.109X14*+0.003X15*+0.176X16*

根据综合评价函数计算得到我国31各省、市、自治区的综合评分,据此我国31各省、市、自治区的综合实力由高到底排序为:广东、江苏、山东、上海、浙江、北京、辽宁、河南、河北、四川、福建、天津、湖北、湖南、安徽、内蒙古、山西、江西、重庆、黑龙江、广西、吉林、山西、云南、新疆、贵州、海南、甘肃、宁夏、青海、。31 省( 市、自治区) 的综合得分基本说明了它们的综合实力, 其中综合得分为正的地区, 说明其综合实力在31 个省( 市、区) 的平均水平之上,而综合得分为负的地区, 说明其综合实力在31 个省( 市、自治区) 的平均水平之下。

五、基于综合实力得分的类型划分

基于主成分分析得到的各地区综合实力得分进行K-means聚类,将我国31 个省( 市、自治区)聚为5类,分别为经济最发达地区,较发达地区,中等发达地区,欠发达地区,不发达地区,得结果如表1所示:

表1 中国各地区综合实力得分与类型划分(括号内为各地区综合实力得分)

从表中可以看出,我国各省、市、自治区中综合实力最强的为广东、江苏两省,而综合实力最差的则为新疆、贵州、海南、甘肃、宁夏、青海、等省,结合我国的地理区域划分可以发现,综合实力较强的省、市、自治区主要集中在我国的东南、华北、东北地区,而综合实力较差的省、市、自治区则主要集中在我国的西南、西北地区。改革开放以来我国经济高速增长,尽管各地区的社会经济都取得了很大的发展,但是区域经济发展不协调问题也日益显现,以广东、江苏为代表的东南沿海地区经济发展速度以及地区综合实力明显高于以宁夏、青海为代表的西北内陆地区,西部地区人均国内生产总值仅相当于全国平均水平的三分之二,不到东部地区平均水平的40%。为了促进我国区域经济的协调发展,我国必须坚定地实行“西部大开发”战略,通过国家政策的扶持,促进经济比较发达地区的资源、国内和境外的资源,能够在市场的驱动下更多地流向西部。

参考文献:

[1]任东明.新时期中国区域发展状态的比较研究[J].地理科学,2000,(2).

[2]何丹.我国31个省(市、自治区)的综合实力评价[J].中国人口・资源与环境,2005,(6).