首页 > 范文大全 > 正文

上市公司信用风险分类准确度比较分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇上市公司信用风险分类准确度比较分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:信用风险管理一直是风险管理的重要组成部分,金融危机的爆发更是显示出信用风险管理和信用风险分类的重要性。本文介绍了不同信用风险分析方法,选取2005-2007年部分被进行特别处理的118家ST公司和126家非ST公司,以其财务指标为样本,进行Logistic回归和BP神经网络分类,对这两种信用风险评判模型在中国市场做了实证研究。结果发现:两种模型均适用于中国上市公司两模式分类(ST和非ST公司),而BP神经网络在中国市场上并未体现其分类的优势,分类准确度和Logistic相当。

关键词:logistic回归 BP神经网络 上市公司 信用风险

在经济全球化的趋势下,信用将成为主要的交易方式,金融危机的爆发更是显示出信用风险管理和信用风险分类的重要性。从20世纪60年代至70年代的统计学方法,20世纪80年代的专家系统到90年代的神经网络,各种信用风险评级方法层出不穷。在我国,信用风险的度量和管理较为落后,金融机构没有完善有效的评级方法和体系,目前所应用的方法主要是粗略的定性方法,如综合利用宏观经济与行业风险、所有权及治理结构、信用风险及其管理、市场风险及其管理、资金来源/流动性、盈利能力等进行“加权”加分,信用风险的度量模式显得比较单一,所以对于信用风险分类方法是学术界和实务界必须解决的课题之一。

一、文献综述

(一)国外文献Logistic模型最早是由Martin (1977)用来预测公司的破产及违约概率。他从1970年至1977年间大约5700家美联储成员银行中界定出58家困境银行,并从25个财务指标中选取总资产净利润率等8 个财务比率,用来预测公司的破产及违约概率,建立了Logistic回归模型,根据银行、投资者的风险偏好设定风险警界线,以此对分析对象进行风险定位和决策。同时还将Z-Score模型,ZETA模型和Logistic模型的预测能力进行了比较,结果发现Logistic回归模型优于Z- Score模型和ZETA模型。Madalla (1983) 则采用Logistic模型区别违约与非违约贷款申请人,其研究结果表明,当违约概率p>0.551时是风险贷款;当p

(二)国内文献 在国内的研究文献中,齐治平(2002)从我国沪、深两交易所选取164 家上市公司,然后随机分成两组,运用线性判别模型、Logistic 回归模型以及含有二次项和交叉项的Logistic 模型对数据样本提前两年进行预测。结果发现,含有二次项和交叉项的Logistic模型对前一年数据的预测准确率最高。吴世农(2003)使用剖面分析、单变量分析、线性概率模型(LPM)、Fisher二类线性判定、Logistic模型等统计方法对财务困境公司进行预测研究,其中Logistic模型对前一年数据的预测准确率达到93.53%,Fisher判别分析法和LPM的准确率都为89.93%。庞素琳(2003)利用多层感知器分别对我国2000年106家上市公司进行信用评级,信用评价准确率高达98.11%。本文即是从上市公司的财务指标入手,通过logistic回归分析和BP神经网络,构建衡量企业信用状况的模型,并通过实证研究考察模型的适用性,对比两者信用风险分类的准确度

二、研究设计

(一)样本选取和数据来源本研究选取沪深两市A股市场上2005年至2007年三年中部分被进行特别处理的118家ST公司和126家非ST公司,数据主要来源于CSMAR深圳国泰安信息技术有限公司提供的财务指标数据,将118家ST公司的财务数据和126家非ST公司的财务数据划分为训练样本和测试样本。样本集选取如(表1)所示。

(二)变量选取本文采取的财务数据在参考了已有文献以及考虑到实际数据可得性的基础上,选取了能够反映短期还款能力,长期还款能力,盈利能力和营运能力4方面共12个财务指标。指标变量名称及自变量符号具体见表。因变量为0-1变量,信用级别高的设置为1,信用级别低的设置为0。在做logistic回归的时候会进一步运用向后筛选法剔除方差贡献率不大的指标变量。具体如(表2)所示。

(三)模型设定

(1)Logistic回归模型:

(2)多层次前向神经网络。本文所应用的是一种称为前向网络的特殊神经网络结构。本研究应用Rumehhart于1986年提出的如下函数:Ii=wijxj+?准,xi=fi=其中,Ii为神经元i的层输入,xi为神经元的输出,wij为神经元间的连接权,?准为神经元i的偏置。每一条连接弧都被赋予一定的数值来表示连接弧的连接强度,正的权值表示影响的增加,负的权值表示影响的减弱。在前向网络中,神经元间前向连接,同层神经元互不连接,信息只能向着一个方向传播。前向网络的连接模式是用权值向量W来表示的。在网络中,权值向量决定着网络如何对环境中的任意输入作出反应典型的学习算法是搜索权值以找到最适合给定样本的权值。在本研究中应用的是多层前向网络的BP算法,其主要作用是知识获取和推理,采用有导师学习的训练形式,提供输入矢量集的同时提供输出矢量集,通过反向传播学习算法,调整网络的连接权值,以使网络输出在最小均方差意义下,尽量向期望输出接近,通过修改各层神经元的连接权值,使误差减小,然后转入正向传播过程,反复循环,直至误差小于给定的值为止。本文建立的BP神经网络图(见图1)。本文建立财务困境神经网络预警模型主要考虑以下两方面的问题:一是确定网络结构;二是学习参数的调整。首先考虑网络结构的确定。网络结构主要包括连接方式、网络层次数和各层结点数。网络的连接方式代表了网络的拓扑结构,Lippmann(1987)证明在一定条件下,一个三层的BP神经网络可以用任意精度去逼近任意映射关系,而且经过实验发现,与一个隐层相比,用两个隐层的网络训练并无助于提高预测的准确。因此在本研究中采用单隐层的BP网络。各隐含层节点数的选择并无确定的法则,只能结合实验并根据一些经验法则:隐层节点数不能是各层中节点数最少的,也不是最多的;较好的隐层节点数介于输入节点和输出节点数之和的50%~75%之间;隐层节点数的理论上限由其训练样本数据所限定。

三、实证结果分析

(一)logistic模型的参数估计及结果常规的线性判别模型计算得到的Z值只是个抽象的概念,无法从经济学上进行解释,Logistic回归分析解决了这个问题,其前提假设符合经济现实和金融数据的分布规律,残差项小要求服从止态分布。本文运用SPSS自带的Wald向后逐步选择法筛选变量,提高模型的判别性能,从全变量模型开始,逐步提出对残差平方和贡献最小的变量,具体的回归结果见(表2)。以2005年为例,根据SPSS计算结果中的参数表,估计Logistics模型的判别方程,(表3)反映了最大似然迭代记录(显示最后的迭代过程),(表4)反映了参数估计结果。步骤9是经过9步变量筛选后最后保留在模型中的变量。从各个系数的Wald值及伴随概率p来看,最终选定的5个指标变量具有最高的解释能力。综上,2005年公司分类的logistic模型为:p=。从(表5)步骤1及步骤9的分类结果看出,剔除不显著变量之后,分类准确率并未大幅下降,可以认为最终的模型能通过检验。(表6)显示了最终的Logistic模型参数估计结果。(表7)显示了模型分类准确率。

(二)BP神经网络的参数估计及结果首先对输入输出样本进行数据处理,消除影响预测结果的噪声,神经网络输入的变量要求规范在[-1,1](若使用tanh函数)或[0,1](若使用logistic函数)之间。本文对输入数据进行标准化处理,采用以下方法:X=。X为规范后的变量,x为每个变量的实际值,x1为每个变量的最小值,x2为每个变量的最大值。Matlab中相应的函数为[output_X,PS]=mapminmax(X,output_min,outpt_max)由于实际财务困境评价往往非常复杂,企业财务状况的好坏与财务比率的关系常常是非线性的,而神经网络作为一种非线形建模过程,并不依赖判别模型的假设,能找出输入与输出的内在联系,因此本文决定尝试使用神经网络技术进行信用状况的分类研究,分为训练集和测试集两组对神经网络进行训练,过程如下:第一,输入层和输出层神经元数目的确定。第一层为输入层,采用判别分析得出的模型变量为输入变量,共有12个结点,每个结点代表相应的财务比率。第三层为输出层,用一个结点表示,训练导师值为0代表信用级别“差”的公司,1代表信用级别“好”的公司。第二,隐含层数和隐结点个数的确定。本文选择单隐层的前馈BP网络;通过学习逐步增加隐神经元数,训练反复调整。最后定为10个隐结点。第三,用训练集的数据训练这个神经网络,使不同的输入向量得到相应的输出值,当误差降到一个指定的范围内时,神经网络所持有的那组权数值就是网络通过自学习得到的权数值,即完成了神经网络的自学习过程。第四,输入待评价的样本(本文直接在输入矩阵中划分为训练),让训练好的神经网络输出企业财务状况的标志(0或1),即实现神经网络的模式分类。神经网络的初始权重由Matlab随机产生的。训练算法采用专用于模式分类的trainscg方法,各种训练参数见(表8)。由此看出,算法逐步收敛,最终达到误差标准见(表9)。

(三)两种模型比较分析 本文对Logistic和BP神经网络分别对我国上市公司的信用状况给予两类模式的评级,最终发现,Logistic和BP神经网络在我国市场上的分类效果相当(见表10)。主流观点认为,人工神经网络具有良好的模式识别能力,可以克服统计等方法的限制,因为它具有良好的容错能力,对数据的分布要求不严格,具备处理资料遗漏或是错误的能力。最为可贵的一点是人工神经网络具有学习能力,可以随时依据新准备的数据资料进行自我学习、训练、调整其内部的储存权重参数以应对多变的企业运作环境。但是本文得出的结果是:传统的Logistic方法和神经网络方法的分类效果相当。现代人工智能方法并未表现出理论上的优势。可能的原因是:网络不稳定,训练样本的仿真准确率很高,但对测试样本的仿真准确率会降低;解释性差,网络最终确定后,每个神经元的权值和阈值虽然已知,但不能很好地分析各个指标对结果的影响程度,对现实问题中的经营管理也就不能起到很好的借鉴作用;网络的输入个数与隐层节点个数的确定没有理论指导,只能通过经验确定。

四、结论

本文选取2005年至2007年部分被进行特别处理的118家ST公司和126家非ST公司,以其财务指标为样本,进行Logistic回归和BP神经网络分类,对这两种信用风险评判模型在中国市场做了实证研究。结果发现:两种模型均适用于中国上市公司两模式分类(ST和非ST公司),而BP神经网络在我国市场上并未体现其分类的优势,分类准确度和Logistic相当。即使如此,本文证实了Logistic和BP神经网络模型对于我国上市公司的评级还是有效的,能够为投资者的科学决策提供建设性的指导意见,使投资者理智地回避风险和获取收益。同时,该判别模型也有利于准确评价一个企业的信用状况,从而为银行等放贷机构提供决策依据。

参考文献:

[1]吴世农、卢贤义:《我国上市公司财务困境的预测模型研究》,《经济研究》2001年第6期。

[2]齐治平、余妙志:《Logistic模型在上市公司财务状况评价中的应用》,《东北财经大学学报》2002年第1期。

[3]庞素琳、王燕鸣、罗育中:《多层感知器信用评价模型及预警研究》,《数学实践与认识》2003年第9期。

[4]Martin D. Early warning of bank failure: a logit regression approach. Journal of Banking and Finance, 1977.

[5]David West. Neural network credit scoring models. Computers & Operations Research ,2000.