首页 > 范文大全 > 正文

基于SAS的ST与非ST股票的选择

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于SAS的ST与非ST股票的选择范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:通过对139只股票的资产负债率,总资产周转率和总资产利润率三方面的分析,找出预测一只股票是否属于st股的方法,方便投资者在选股票的时候确定所选股票是否属于ST股票。

关键词:SAS股票;神经网络

一、选题背景

ST是英文Special Treatment缩写,意即“特别处理”。该政策针对的对象是出现财务状况或其他状况异常的。1998年4月22日,沪深交易所宣布,将对财务状况或其他状况出现异常的上市公司股票交易进行特别处理(Special treatment),由于“特别处理”,在简称前冠以“ST”,因此这类股票称为ST股。当一个公司的连续出现两年亏损的时候,就会加上ST,提醒投资者这只股票可能在一年后退市。由于ST股是一些财务状况不好的、可能退市的股票,因此投资者若是购买的是ST股票,会使用完全不同的投资决策,因此投资的股票是否是ST股票对于投资者在做投资决策的时候是非常重要的。

二、研究问题与技术方法

(一)研究问题

由于还没有一种典型的函数来确定股票是否属于ST股,所以,预测股票是否属于ST股是很困难的。在本次研究应用中,将140支已发行股票分为两类。将股票分类后,以此来判别基础。

(二)技术方法-模型训练及预测

预测模型的训练一般有三种方法,分别是神经网络、决策树、回归分析。

1.神经网络(Neural Networks),是通过不断调整各个输入数据权重使得输出的预测值与数据实际值的均方误差最小化的模型。这种不断调整的过程就是对神经网络的训练。这一训练过程是不可见的。

2.决策树(Decision Tree),决策树是一种结构。通过应用简单的决策规则,利用这种结构可以将大型记录集分割成相互连接的小型记录集。通过每一次连续分割,结果集中的成员彼此变得越来越相似。决策树是一种类似流程图的树型结构,其中树的每个内部节点均代表一个属性的测试,其分枝就代表测试的每个结果,而树的每个叶节点就代表一个类别,树的最高层节点就是根节点,也是整个决策树的开始。决策树模型包含一系列规则,按照某个相关的特定目标变量,可将大量包含不同种类的总体分割为更小的、更相似的群组,它可用于计算给定记录归属于某一个类别的概率,也可以通过将记录分配到最可能的类来给记录评分。训练决策树模型的过程,实质是确定最佳规则的过程。

3.回归分析(Regression),是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。这一方法可以用来预测其中的变量值。训练回归模型的过程,实质是确定变量之间定量关系的过程。

在本次研究中,将用数据分别训练三个模型,判断出哪种模型的预测效果最佳,并用这种模型对将要上市的股票做出预测。

三、数据挖掘技术应用

(一)导入数据

将收集到的数据导入SAS中,通过运用这些数据进行模型的训练和预测。

(二)SAS模型训练

SAS流程图如图一。实际过程中,根据神经网咯、决策树和回归分析的效果来决定预测模型的选取。

主要步骤:

1.在SAS中导入已选择相关企业训练数据,并把variables中的F2选项定义为target。

2.在data partition 节点中选择样本随机方法,并设置各部分比例。将各部分比例设为train 40%,validation 30%,test 30%。

3.运行assessment得到如下结果

从上图中可以看出在10%比例的情况下,神经网络模型和逻辑特回归模型都可以到达100%的正确率,但是在20%比例的情况下,只有神经网络模型可以达到100%的正确率,因此神经网络模型的拟合较好,我们选择神经网络作为预测模型。

四、神经网络模型分析

(一)神经网络模型

根据SAS的神经网络模型的运行结果,我们可以得到如下的权值:

根据结果可以看出,在42个数据取20%的时候,我们取第九个数,这九个数的预测都是百分之百正确的,正明这个神经网络模型的效果是显著的,因此我们取0.8752作为阈值,当算出来的阈值大于0.8752的时候就归为1-ST股,否则为0-非ST股。

(二)预测

用测试的数据集来进行预测,也就是看测试集里面的股票哪些是属于被ST的,哪些是没有被ST的,根据SAS的运行结果得到如下所示的图。

从图中可以看出前20只股票的阈值都大于0.8752,因此基于神经网络模型的分类,前20只股票都应属于ST股,而在实际情况下第7只望春花和第17只力诺工业却不是ST股票。因此通过对比,我们可以看出,神经网络的分类是比较准确的,但是也不能做到百分之百的正确率,我们可以依据神经网络模型对不确定的股票进行预测,判断它是属于ST股票还是属于非ST股票,帮助我们在证券投资上做出投资决策。由于这种分类不是百分之百正确的,我们也不能完全依靠模型做出来的结果进行预测,还应根据其他指标,如,宏观经济与其他基本面的分析对股票投资进行分析。

五、结束语

通过运用sas软件,比较了决策树,逻辑特回归和神经网络三个模型哪个的拟合效果更好,最后决定运用神经网络模型。通过使用神经网络模型,把数据分成了两类-st和非ST股,并且确定了预测的阈值,推出了预测的条件,为我们预测一只股票是否属于ST股票提供了条件。

虽然在本次应用中,我们得出了预测结果,但在一些方面仍然有不足的地方。首先在选择财务指标考虑的不是很全面,选择的数据变量可能主观性比较大。在未来的研究中,我会在不足的方面进行完善,以提高预测的准确性。

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文