首页 > 范文大全 > 正文

SPSS聚类分析在证券价格预测及期权定价中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇SPSS聚类分析在证券价格预测及期权定价中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】本文将聚类分析方法运用到证券价格预测及期定价中,对股票的成交额、开盘和收盘三个特征通过spss软件进行聚类分析,产生多个分类结果。其中:同一类内的股票在特征之间具有较高的相似性,不同类间的则差异性较大。在此选择了分层聚类分析-离差平方和法和快速聚类分析对股票进行分析。

【关键词】SPSS软件;分层聚类分析-离差平方和法;快速聚类分析

1.引言

证券投资是随着市场经济的发展和资本市场的建立应运而生的,由收益、风险和时间三个要素构成,其具有高度的“市场力”。

聚类分析是依据研究对象的个体特征,对其进行分类的方法,其能够将样本数据根据其诸多特征,按照在性质上的亲疏程度进行自动分类,产生多个分类结果。

本文主要根据股票的成交额、开盘和收盘三个特征对选中的10个股票样本进行分类,产生3个分类结果。

2.分层聚类分析-离差平方和法

(1)基本思想:首先将一定数量的样本各自看成一类,然后根据样本的亲疏程度,将亲疏程度最高的两类进行合并,然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,直到将所有的样本合并为一类。

(2)数据。

(3)具体步骤:1)导入编辑好的excel数据文件。2)点:Analyze

——Classify——Hierarchical Cluster。3)把股票名变量选入右边的Label Cases选框,再把除了股票名之外的变量全选入右边Variables选框,在Cluster中选择“Cases”,在Display中选择“Statistics”和“Plots”。4)点Plots——选中“Dendrogram”和下面的“None”。5)点Statistics——选中“Agglomeration schedule”和下面的“None”。6)点Method——在Cluster Method栏选择“Ward’s method”,选中Interval栏并选择“Euclidean distance”,在Standardize栏选择“Z scores”并选中“By variable”。7)点Save——在Range of solutions栏填2-4。

(4)得到结果。

共10例样本进入聚类分析显示合并进程。第一步:2与3被合并,相关系数为0.047;第二步:7与10被合并,相关系数为0.131;第三步:6与第二步的合并项被合并,相关系数为0.346;第四步:第一步的合并项与5被合并,相关系数为0.692;第五步:1与4被合并,相关系数为1.043;第六步:第四步的合并项与第三步的合并项被合并,相关系数为1.851;第七步:第五步的合并项与8被合并,相关系数为3.333;第八步:再与9被合并,相关系数为5.269;第九步:再与第六步的合并项被合并,相关系数为9.105。

上面是用更为直观的聚类树状关系图表示。我们将所有样本分为3类:第一类有中海集运;第二类有华发股份、天士力和九州通;三类有长春燃气、士兰微、方正科技、福建水泥、合肥百货和南京医药。

3.快速聚类分析法

(1)基本思想:首先按照一定方法选取一批聚心,再让样本向最近的聚心凝聚,形成初始分类,然后再按最近距离原则修改不合理的分类,直到合理为止。

(2)数据(同分层聚类)。

(3)具体步骤:1)导入编辑好的excel数据文件。2)点:Analyze

——Classify——K-Means Cluster。3)把股票名变量选入右边的Label Cases选框,再把除了股票名之外的变量全选入右边Variables选框,在Method中选择“Iterate and classify”,在Number of Clusters中填“3”。4)点Iterate—在Maximum Iterations栏填“10”。5)点Plots——在Statistics栏选中“Initial cluster centers”和“Cluster information for each case”。6)点Save——选中“Cluster membership”和“Distance from cluster center”。

(4)得到结果。

可以看出,第2类与第3类之间的距离要比第2类与第1类之间的距离小。

可以看出,第1类有7个样本,第2类有1个样本,第3类有2个样本。

可以看出,第3列表示的是该样本属于哪一类,第4列表示该样本与其所属类别重心之间的距离。

分析上表可知,若采用“快速聚类法”,第1类有华东股份、长春燃气、士兰微、天士力、南京医药、福建水泥和合肥百货;第2类有中海集运;第3类有方正科技和九州通。

4.结束语

比较两种方法的结果可以看出,其分析结果大致相同。为此我们可以得到合理的聚类方法就是将所有样本分为3类。

分层聚类法:优点-既可以对样品也可对变量进行聚类,既可以连续变量也可以是分类变量,提供的距离计算方法和结果显示方法也很丰富。缺点-易受异常值的影响。

快速聚类法:优点-计算量小、处理速度快,适合大样本的聚类分析。缺点-应用范围有限,要求制定分类数目,只能对样本聚类,而不能对变量聚类,且所使用的聚类变量必须都是连续性变量。

参考文献

[1]张艺伟,赵月,陈媛,等.各地区各行业工资水平的分析.2009.

[2]宋志刚,何旭洪.SPSS 16实用教程[M].人民邮电出版社.2008.

[3]周焯华,陈文南,张宗益.聚类分析在证券投资中的应用[J].重庆大学学报,2002.

[4]薛薇.SPSS统计分析方法及应用[M].电子工业出版社,2009.

作者简介:盛慧蓉(1990—),现就读于杭州电子科技大学,研究方向:统计学。