中国物流园区省区分布的聚类分析(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇中国物流园区省区分布的聚类分析范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要：在对中国31个省（直辖市、自治区）的物流园区供给数量、需求水平及基础配套设施状况三类数据进行去量纲处理和单因素方差分析的基础上，运用动态聚类分析方法把中国大陆31个省（直辖市、自治区）在这三类因素维度进行聚类，研究各地区在物流园区供给、物流园区需求以及支持园区发展的基础配套设施三者之间的匹配程度和差异状况后发现，中国物流园区区域布局存在着结构性不合理。因此，对中国区域物流园区进行规划应结合中国经济发展的实际，通盘考虑，合理布局。

关键词：物流园区；区域规划；动态聚类

中图分类号：F252.24 文献标识码： A 文章编号：1003－3890（2008）04－0031-04

一、引言

最近几年，中国各地区兴起了物流园区建设的热潮。然而，一些园区建成后却面临着闲置和经营困难的局面。此外，截至目前，中国物流园区区域规划仍缺乏明确的制定依据。这些情况向我们提出了以下问题：区域物流园区的规划应以哪些因素为依据？中国各省区现有物流园区供给数量是否合理？对于这些问题，国内外学者进行了深入探讨。较高的区域经济发展水平与当地政府的有力支持被认为是物流园区发展的必要基础[1]。房殿军通过总结德国物流园区发展的实践，认为物流园区数量应与区域经济发展水平、物流需求及基础设施条件相适应[2]。李春海等通过总结现有国内外区域物流园区规划的文献，认为区域经济发展水平及区域贸易货运量是确定物流园区数量的依据[3]。还有一些学者则运用因子分析法指出影响区域物流需求的关键因素包括区域生产、区域贸易、区域流通作业能力等几个方面[4]。

现有的研究文献主要从定性的角度指出区域物流园区数量应与当地经济发展水平及其所引致的物流需求和区域基础配套设施相匹配[5]，而对三者之间关系进行定量研究的文献目前尚为少见。笔者在现有文献的基础上，采用聚类分析的方法对中国大陆31个省（直辖市、自治区）的物流园区供给数量、经济发展水平所引致的物流需求和物流园区发展所需基础配套设施水平这三类因素进行了数据处理，并将处理结果进行比较后发现我国区域物流园区布局中存在着一定的问题。基于此，笔者拟对我国物流园区的总体布局与数量规划进行一些尝试性探讨。

二、参数选取与数据处理方法

（一）参数选取及数据来源

1. 31个省（直辖市、自治区）的物流园区供给状况。2006年底至2007年初，为全面了解和掌握全国物流园区的建设和经营情况，国家发展和改革委员会和中国物流与采购联合会联合组织了一次全国性的物流园区调查。该调查对全国各省区物流园区的供给情况从四个方面进行了统计，即各地区已建成的在运营物流园区数量、正在建设的物流园区数量、未来规划将建的物流园区数量和各地区物流园区总量（单位：个）。这四个指标分别从已建成、即将建成、未来将建以及总量四个维度来反映一个地区物流园区的供给情况。笔者采用这四个指标来衡量各省区物流园区的供给情况。数据来源为2007年国家发展和改革委员会与中国物流与采购联合会联合的《全国物流园区发展调查报告》[6]。

2. 31个省（直辖市、自治区）的经济发展水平与物流园区需求状况。汪涛等运用因子分析法指出了影响物流市场需求的因素[7]。结合他们的研究，笔者选取以下指标来反映各地区经济发展水平与物流园区的需求：2005年各地区生产总值（单位：万元）；2005年各地区国有及规模以上的非国有企业数量（单位：个）；2005年各地区国有及规模以上的非国有企业总产值；2005年各地区社会消费品零售总额（单位：亿元）；2005年各地区农、林、牧、渔总产值（单位：亿元）；2005年各地区货运量（单位：万吨）。以上数据均来自《2006年中国统计年鉴》[8]。

3. 31个省（直辖市、自治区）的物流园区发展所需的基础配套设施状况。研究表明，物流园区的长期运作情况与所在区域铁路、航线、公路路网结构和密度以及政府配套基础设施的支持密切相关[9]。笔者选取了四个指标反映各地区的基础配套设施情况与政府财政支持力度，它们分别是：2005年各地区铁路营业密度（单位：公里/每公顷）；2005年各地区内河航道密度（单位：公里/每公顷）；2005年各地区公路密度（单位：公里/每公顷）以及2005年各地区财政支出总额（单位：万元）。以上数据来源为《2006年中国统计年鉴》。

（二）数据处理方法

1. 聚类分析的思路。聚类分析方法广泛运用于国内外经济、管理实践[10][11]，但是目前国内将该方法运用于区域物流园区数量规划研究的文献还较少见。它是一种将分析对象按照其相似程度分类，并寻找不同类别事物特征的统计分析工具。聚类分析有三种具体方法，分别是系统聚类法（Hierarchical Cluster）、两阶段聚类法（Two-step Cluster）及动态聚类法（K-means Cluster）[12]。动态聚类法，即K-means Cluster，它具有动态性、简洁性和直观性的特征，笔者采用该方法对样本点进行聚类分析。K-means聚类方法的基本思路是：（1）初步指定聚类数目K，形成K个初始类中心点（或称凝聚点）。（2）计算所有样本数据点到K个初始类中心点的欧氏距离（Euclidean Distance，EUCLID）。欧氏距离计算公式为：

其中：X为样本点；Y为初始类中心点；xi为样本点第i个数据取值；yi为初始类中心点第i个数据取值。根据欧氏距离最小的原则将所有样本分派到各初始类中心点所在的类，形成一个分类方案，完成一次迭代，并计算出各类中样本变量的均值，得到各类的重心。（3）将各类的重心替代初始类中心点，形成新的类中心点。（4）重复步骤2和3，直到分类结果达到指定的迭代次数或迭代收敛程度。（5）最终形成K个类别。

2. 数据量纲的处理。运用聚类分析方法处理数据时，同一样本不同指标之间量纲的差异会影响聚类输出结果的有效性，解决这一问题的方法是根据样本数据特征采取去量纲处理。笔者采用的是Z-scores方法使数据标准化均值为0，标准差为1的无量纲数据。

3. 单因素方差分析（ANOVA）。聚类过程中指标的选取很重要，并非引入的指标越多越好，无关指标的引入，会降低聚类的准确性。为了避免这一现象，笔者对参与聚类分析的指标进行单因素方差分析检验（ANOVA），只有通过F检验和P检验的指标，才被认为对聚类效果有显著影响。

4. 分析软件。笔者聚类分析所采用的统计分析软件为SPSS14.0。

三、聚类分析

（一）各地区物流园区供给状况的聚类分析

由于各地区物流园区供给因素四个衡量指标的单位统一，量纲一致，因此不需要进行数据的标准化处理就可直接对数据进行K-means聚类，将我国31个省（直辖市、自治区）的物流园区供给分为三种类型，各类型聚类中心点情况如表1第四、五、六列所示。中国31个省（市、自治区）的物流园区供给类型见表4第二列所示。

聚类结果和各类型的中心点属性显示：在全国31个省区中，江苏省属于区域物流园区供给量最大的省区类型；北京、天津、内蒙古、浙江、广东等8个地区属于省际物流园区供应量居中的类型；上海、河北、山西、黑龙江等22个地区属于省际物流园区供应量较少的类型。参与聚类的四个指标的ANOVA分析结果如表1第二、三列所示，表明四个指标在各种类型间存在显著差异，聚类分析结果准确。

（二）各地区经济发展水平与物流园区需求状况的聚类分析

由于各地区经济发展水平与物流园区需求因素所涉及的六个指标单位量纲不一致，因此对所有数据先运用Z-scores方法进行标准化后再聚类。运用标准化后的数据将中国31个省（直辖市、自治区）的经济发展水平及物流园区需求分为三种类型，各类型聚类中心点情况如表2第四、五、六列所示。中国31个省（直辖市、自治区）经济发展水平和物流园区需求类型见表4第三列所示。

聚类结果和各类型中心点属性显示：在全国31个省区中，广东、浙江、山东、江苏四个地区属于区域经济发展水平最高、物流园区需求量最大的省区类型；河北、山西、内蒙古、上海、湖南等11个地区属于物流园区需求居中的省区类型；北京、天津、内蒙古、吉林、江西等16个省区属于物流园区需求量最少的省区类型。参与聚类的六个指标ANOVA分析结果如表2第三、四列所示，表明各指标在不同类型间存在显著差异，聚类分析结果准确。

（三）各地区配套基础设施状况的聚类分析

由于各地区物流园区发展所需配套基础设施因素所涉及的四个指标量纲不同，因此在进行聚类分析前，需要对数据进行标准化去量纲处理。对所有数据运用Z-scores方法标准化后将31个省区的基础设施状况聚类成三种类型。各类型的聚类中心点情况如表3第四、五、六列所示：其中第一种类型的省区区域铁路、公路、航道里程密度最高，地方政府财政支出最为丰厚，物流园区发展的配套基础环境最优越，这一类型省区包括上海、江苏、广东三地（见表4）；第二种类型的省区区域铁路、公路、航道里程密度较高，地方政府财政支出较为丰厚，物流园区发展的基础配套环境较好，这包括北京和天津两地；其余的河北、山西、内蒙古、浙江、山东等26个省区属于第三种类型，即区域内铁路、公路、航道里程密度最低，地方政府能提供的财政支持较少，物流园区发展的配套基础设施不够完善。参与聚类的四个指标的ANOVA分析结果如表3第三、四列所示，表明四个变量在各种类型间存在显著差异，聚类分析结果准确。

四、聚类结果的比较与分析

将中国31个省（直辖市、自治区）的物流园区供给状况、经济发展水平与物流园区需求状况、物流园区长期发展所需的配套基础设施状况的聚类结果综合起来进行比较（如表4所示），可以发现中国物流园区区域规划与布局中存在着一些问题。

聚类结果的比较显示：中国省际物流园区的区域供给与区域经济发展水平及物流园区需求不匹配问题突出。一些省区的物流园区供给数量相对于当地的经济发展水平和物流园区需求明显过剩，如北京、天津、内蒙古、甘肃等省（市、自治区）；与此同时，广东、浙江、山东、上海、四川等地，其区域经济发展水平较高，物流园区的需求比较迫切，但当地物流园区供给相对滞后。

聚类结果显示的另一个突出问题是：物流园区发展所需的配套基础设施严重落后，政府能为物流园区提供的支持力度较弱，制约着园区的良好运作和长期发展。如表4第四、八列显示，中国仅上海、广州、江苏、北京、天津五个区域基础设施较为完善、政府财政力度较大，其他26个省区的铁路密度、内河航道里程、公路状况以及政府财政支持力度等物流园区长期发展所需的配套基础设施都属于第三类，这种环境将导致园区建成后在运作的效率和成本上遭遇硬件瓶颈，导致园区经营困难。这也是中国目前大量园区建成后发展不顺利的重要原因之一。

五、总结

笔者通过对中国大陆31个省（直辖市、自治区）物流园区供给、经济发展水平与物流园区需求、物流园区发展所需的配套基础设施条件数据的聚类分析，量化了区域物流园区布局的要素，揭示了三者之间的关系，指出了中国物流园区区域布局存在的问题，并为将来的发展提供了解决思路。尚待研究的问题是：由于此次发改委的物流园区统计调查数据没有统计包括各个物流园区的规模、设施状况等指标，随着对中国物流园区统计调查的不断完善，应将这些指标纳入模型考虑范畴。

参考文献:

［1］Tsai，M. C.，Su，Y. S. Political risk assessment on air logistics hub development in Taiwan. Journal of Air Transport Management.

［2］房殿军.德国物流园区规划方法［J］.中国物流与采购，2005，（12）.

［3］李春海，缪立新.区域物流系统及物流园规划方法体系［J］.清华大学学报（自然科学版），2004，（3）.

［4］范辉政.我国物流园区发展的区域差异分析［J］.统计研究，2006，（7）.

［5］王洁，陈功玉.对我国物流园区发展现状的思考［J］.物流技术，2007，（8）.

［6］国家发展和改革委员会，中国物流与采购联合会2006年重点研究课题报告课题组.全国物流园区发展调查报告［J］.中国物流与采购，2007，（5）.

［7］汪涛，连玮佳.我国物流市场的区域差异分析［J］.物流技术，2006，（9）.

［8］国家统计局编.中国统计年鉴（2006）［M］.北京:中国统计出版社，2006.

［9］Tsai， M. C.， Wen， C. H.， Chen， C. S.， Demand choices of high-tech industry for logistics services providers-an empirical case of an offshore science park in Taiwan［J］. Industrial Marketing Management， 2007:617-626.

［10］David R. Anderson， Dennis J . Sweeny， Thomas A.Williams. Statistics for Business and Economics［M］. Thomson Press， 2005.

［11］Joseph F. Hair， William C. Black， Barry J. Babin， et al. Multivariate Data Analysis［M］. Pearson Education international Press， 2006.

［12］李金林，赵中秋.管理统计学［M］.北京:清华大学出版社，2006.

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”

中国物流园区省区分布的聚类分析

常用范文

优秀范文

精选范文