首页 > 范文大全 > 正文

基于遗传模糊聚类的长江干线下游集装箱港口发展分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于遗传模糊聚类的长江干线下游集装箱港口发展分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:长江沿线内河港口各有特色,港口之间的合作与竞争并存。为了推进长江“黄金水道”的全面发展,

需要对长江沿线内河港口的发展情况进行科学分析。将遗传算法和模糊目标函数C-均值聚类算法

(FCM)相结合,对长江干线下游7个集装箱港口进行了聚类分析,最后根据聚类结果提出了长江

干线下游集装箱港口的发展定位。

关键词:长江干线 集装箱港口 遗传算法 模糊聚类

基于遗传算法的模糊目标函数C-均值算法简介

模糊目标函数C-均值算法(FCM)是现在相当流行的一种模糊聚类算法,它被广泛地应用于各个领域,但由于它是一种局部搜索算法,存在着两个致命的弱点:一是在处理大数据集时花费的时间相当多;二是对初始化非常敏感所以很容易陷入局部极小值,所以在实际问题应用中受到了很大的限制。而遗传算法是一种搜索能力强大的全局搜索算法,它的主要优点是简单、通用、鲁棒性强和适合并行处理,如果把这种方法与FCM算法相结合就可以弥补FCM算法的缺点,达到理想的聚类效果。本文主要研究的是基于遗传算法的模糊聚类算法,可以得到一种能改善聚类效果、提高收敛速度的新方法。

基于遗传算法的FCM聚类算法如下:

编码:使用适合于模糊聚类算法的用聚类中心作为染色体的浮点数编码方法。把一条染色体看成由c个聚类中心组成的一个串:,由于每个聚类中心有s个特征,因此一条染色体是长度为的浮点码串。假设种群大小为N,则要按以上方法生成N条染色体来组成初始种群。

适应度函数:以F作为适应度函数。其中,

(1)

(2)

(3)

(4)

Z(?簸;V)为类别方差,全集为X={x1,x2,・・・,xk,・・・,xn},c为聚类中心个数,m(m?叟1)是一个给定的数,为?簸=[?滋ik]模糊分类矩阵(且?簸ik=[0,1] i,k)。

选择和复制:为了保证每一代的进化过程中当前最优个体不会被遗传操作所破坏,采用比例选择与最优保存策略相结合的混合选择算子。我们先选择群体中10%的优秀个体直接进入下一代,剩下的部分按比例选择(用随机遍历抽样算法)进行选择。

交叉:本文采用浮点数编码方式,所以使用算术交叉算子。算术交叉是指由两个个体的线性组合而产生出新的个体:

Child=parent1+?琢(parent2-parent1)(5)

其中是[0,1]范围内的随机生成数,Child是新个体,parent1和parent2是两个旧个体。

变异:采用实值种群的变异函数mutbga( )进行变异,先产生个中间任务表决定变异的变量,再产生第二个中间表标识正常的变异步长大小。变异的变量由变量加步长形成。

个体的FCM优化。由于FCM法是一种局部搜索能力较强的算法,因此本文在每一代执行完遗传操作后对其进行FCM优化,优化后的群体才会进入下一次演化。这样做不仅可以提高混合算法的局部搜索能力,同时又有利于提高其收敛速度。具体的优化方法如下:①根据每条染色体的聚类中心编码值,计算各自新的模糊分类矩阵U;②根据模糊分类矩阵U,计算新的聚类中心矩阵V并编码成为新的染色体;将以上产生的N条新的染色体作为新一代种群开始下一次的遗传操作。

终止:最大重复执行次数为200。

解码:在最后一代中找出适应度最高的染色体,它所对应的聚类中心矩阵V即为混合算法所得到的最优解。由这个最优聚类中心矩阵按照式计算得到最优模糊分类矩阵U,再根据最大隶属度原则来确定最优的聚类划分并输出,这样就完成了整个算法的执行过程。

港口聚类影响因素分析

港口营运水平:衡量一个港口能力大小的根本性指标在于港口的营运生产能力,本文用集装箱吞吐量和货物吞吐量指标来进行描述。

港口增长水平:港口增长水映了港口未来发展潜力的大小,本文采用港口建设投资以及集装箱吞吐量增长系数进行描述。

集装箱吞吐量增长系数:按照过去5年(2004-2008)集装箱吞吐量增长率的平均值计算。

港通水平:港口位于发达的交通运输枢纽地区,可以扩大其对货物的吸引范围,尤其是对中转货物的吸引量。相对完善的交通运输条件,可以促进经济的发展,刺激运输需求量的增长,为港口的长远发展创造条件。本文用交通环境系数来衡量港通水平。

交通环境系数:反应港通运输道路基础状况。根据连接地级及地级以上城市的高速公路、国道干线公路、省道公路、铁路的条数,按一定的系数(高速、国道、省道权重分别为:0.4、0.35、0.25;公路、铁路权重分别为:0.55、0.45)进行折算而确定。

港口设备水平:港口设备条件反映了港口进行生产营运的支持保障能力的高低。其评价指标可以采用生产用码头泊位、生产用装卸机械以及生产用堆场来进行衡量。

长江干线下游集装箱港口的遗传模糊聚类分析

对长江干线下游集装箱港口进行模糊聚类分析的目的是将港口进行分类,针对不同层次港口的特点对港口进行定位,制定不同的港口发展战略和策略,做到有的放矢。结合影响港口聚类的影响因素,对港口进行遗传模糊聚类分析的背景为:

选择长江干线下游的南京、江阴、镇江、南通、扬州、泰州和苏州7个主要集装箱港口分成3类进行聚类分析。

选择7个港口的集装箱吞吐量、货物吞吐量、港口建设投资、集装箱吞吐量增长系数、交通环境系数、生产用码头泊位、生产用装卸机械以及生产用堆场8个指标作为聚类分析特征指标。

聚类分析指标中的前6项指标值以及集装箱吞吐量增长系数的基础数据来自《中国港口年鉴2009》;交通环境系数的基础数据来自《中国交通营运里程图(新编版)》。

表12008年长江干线下游主要集装箱港口聚类特征指标值

表22004-2008年集装箱吞吐量增长率(单位:%)

采用MATLAB7.9.0(R2009b)对遗传模糊聚类算法进行编程,通过计算获得7个港口对应3个类别的模糊聚类隶属度见表3。

表3 各城市对应类别的隶属度

根据上表,得到长江干线下游集装箱港口的聚类分析结果如下:

一类港口――苏州港、南京港

二类港口――南通港、江阴港

三类港口――镇江港、扬州港、泰州港

从港口所处地理位置以及港口发展的角度,一类港口是地区干线港,在长江干线下游集装箱港口体系中最高层次的港口,可以发展为区域性集装箱枢纽港,主要负责上海港的喂给协作工作。二类港口是地区支线港,其基础设施与营运能力等与一类港口存在一定的差距,主要负责地区干线港的重要补充工作。其中,一类和二类港口可以作为上海港的侧翼与上海港形成组合港口共同发展,形成以上海枢纽港为核心,苏州港和南京港为干线喂给港,南通港和江阴港为支线喂给港的规模等级港口体系。

(作者单位:交通运输部水运科学研究院)