首页 > 范文大全 > 正文

中小企业信用评价模型研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇中小企业信用评价模型研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

1.引言

信用是市场经济的重要基础,是企业进入市场的通行证,拥有良好信用的企业在社会交往和商品交换中处于有利地位。信用评价是对各类企业所负各种债务能否如约还本付息的能力和可信任程度的评估。客观权威的信用状况的评价,可以为其申请发债、贷款、发行股票以及商业往来提供资信证明,因此,准确客观的信用风险评价对一个企业的发展至关重要。

改革开放以来,我国中小企业得到迅猛的发展,对国民经济的健康、持续、稳定发展,在创造就业机会、推动技术创新、加快市场化进程等方面都发挥着日趋重要的作用。然而,国内外汗牛充栋的关于中小企业信用问题的理论研究几乎步调一致地认为,中小企业普遍由于资本规模小,管理不规范,技术水平低等原因而导致其信用水平低。实际上,信用担保公司已保和在保的中小企业违约现象却很少发生。由于对中小企业的信用评价不当,造成中小企业融资困难,严重地影响着中小企业的发展。

造成中小企业信用评价低的原因,一方面在于目前执行的信用评价指标体系,从评级方法、评价指标的选择以及指标的权重来看,都是基于国有大型企业的特点制定的,没有专为中小企业制定专门的信用评价体系。另一方面大部分中小企业经营历史不长,经营状况变动幅度大、财务数据不完备等,传统的统计分析方法不能进行有效分析等原因。

近几年,随着计算机技术的发展,一些非参数统计方法以及人工智能模型逐渐被引进信用评价模型中,如神经网络、模糊分类、遗传算法等,这些算法在一定程度上克服传统方法综合分析能力差、缺乏整体概括能力的缺点,弥补了评价结果的一些不足。但还存在样本需求量大,人为干预多的缺点。

基于小样本理论的支持向量机(Support Vector Machines 简称SVM)方法基本上不涉及概率测度的定义及大数定律等,因此不同于现有的统计方法,是一种具有严密理论基础的计算机学习的新方法。为解决基于数据的非线性建模问题提供了一个新思路。建立SVM模型所需要的先验干预也较少,它已经成为机器学习、模式识别、计算智能、预测预报等领域的热点技术,受到国内外的广泛关注。

2.支持向量机

支持向量机基于统计学习理论和结构风险最小化原则,其基本思想是把输入空间的样本通过非线性变换映射到高维特征空间,然后在特征空间中求取把样本线性分开的最优分类面。算法使用分类间隔控制线性学习机器的容量,从而使结构风险最小,也使其在有限样本下具有了较强的泛化能力。不同的核函数即变换到不同的特征空间,使用核函数也避免了在高维的特征空间中直接计算。

2.1支持向量机的分类算法

支持向量机是从线性可分情况下的最优分类面发展而来的,所谓最优分类面就是要求分类面不但能将两类正确分开, 而且使分类间隔最大。以二维情况为例,如图1所示,圆点和方框分别表示两个类别。H为分类线,H1,H2 分别为过各类中离分类线最近的样本且平等于分类线的。

设线性可分样本为 是类别号。d维空间中线性判断函数的一般形式为,分类面的方程为。将判别函数归一化,使两类所有的样本满足。此时分类间隔等于,使间隔最大等价于使 最小。使式等号成立的样本叫做支持向量,满足且使最小的分类面就叫做最优分类面。

求最优分类面的问题可以转化为优化问题:

使用Lagrange乘子方法解决这个约束最优问题,即在约束条件 和 (为Lagrange乘子,)下求解下列目标函数的最大值。

这是一个不等式约束下二次函数寻优的问题, 存在唯一解。不为零的解所对应的样本就是支持向量。解上述问题后得到的最优决策函数是:

在线性不可分的情况下, 可以增加一个松弛项 , 成为:

,

将目标改为求:

的最小且 ,其中,C是惩罚因子,即综合考虑最少错分样本和最大分类间隔, 这样就得到广义最优分类面。

对于非线性问题,只需要将输入向量非线性映射到一个更高维的特征空间,然后再构造最优分类超平面。我们不必知道具体的映射函数 的表达式,因为在这个高维空间中只涉及到内积运算,若,则称 为内核函数,一个函数是核函数的条件由Mercer定理给出。而相应的最优决策函数变为:

2.2内积核函数

核函数 的要求是满足Mercer定理,在这个要求内怎样选择它有一定的自由度,选择不同的核函数可以构造不同的支持向量机。目前,支持向量机普遍采用的内积核函数有三类:

一是多项式核函数:;

二是径向基核函数: ;

三是多层感知器核函数: ;

用于支持向量机的多项式和径向基函数类型的内积核总满足Mercer定理,而对于多层感知器核函数只有一些特定的 值满足Mercer定理。

3.中小企业信用评价指标的选取

中小企业是企业群体的组成部分,因而其信用评价体系可以从企业评价体系演绎得到,但与大型企业相比,中小企业自身又具有成长性、创新性等特点,因此,在设计中小企业信用评价体系时,不仅要高度重视资产负债率、流动比率等财务指标,也要充分考虑企业的成长性,创新性适应性等非财务分析指标。研究中还发现,由于中小企业尤其是一些小型企业,法人对企业信用的影响起着重要的作用,因此法人的信用水平也是中小企业的信用评价的一个重要方面,基于以上考虑,本文主要选取以下主要指标。

表1.中小企业信用评价指标

4.模型设计及结果分析

4.1模型设计

信用评价本质上是模式识别中的一类分类问题,将企业划分到二个或者几个类中(如:能够按期还本付息的“好”客户,可能会违约的“坏”客户等)。具体做法主要是根据历史上每个类别的若干样本,从已知的数据中找出各类别的特征,从而总结出分类规则,建立数学模型,用于测量借贷企业的违约风险。

本文结合模式识别的一般方法和SVM的特点,信用评价模型流程设计如图2,首先收集数据并将收集到的数据经过清洗及处理后输入模型中进行学习,达到初始的误差设定标准后,再用测试数据进行测试,满足准确率的要求后,则可以进行应用,否则调整相关参数,再进行学习和测试,直至满足条件。

4.2 数据处理

本文根据收集到的46家中小企业一次融资过程进行调查分析和财务报表计算得出以上指标的相关数据,为了对基于支持向量机的信用评价方法进行比较分析,我们首先对其进行归一化处理,然后随机选择其中30家数据作为训练样本,其余16家企业的样本数据作为测试集。利用S. Canu 、Y. Grandvalet、V. Guigue、A. Rakot等人开发的基于MATLAB的支持向量机工具箱进行验证。

4.3 测试结果

根据SVM-KM工具箱,我们适当调整参数,设置lambda = 1e-7; C = 1000;kernel='gaussian';运行后分类结果的混淆矩阵(confusion matrices)如下:

4.4 对比分析

为了对比SVM方法,我们利用BP人工神经网络构建模型与之比较。BP人工神经网络模型采用MATLAB自带的ANN的工具箱构建,利用常用的3层人工神经网络结构,输入层18个神经元,隐含层20个神经元,输出层1个神经元,终止条件为标准差为0.01或者运行1000步,其它按照工具箱默认设置,当运行781步时收敛。输入测试函数得到分类结果如下:

不仅从混淆矩阵可以进行比较,我们还可以利用ROC曲线可以直观地发现。ROC曲线 (receive operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、特异性为横坐标绘制成曲线,曲线下面积越大,分类准确性越高。如图3,两种分类法对应有ROC曲线可以看出,SVM的ROC曲线下方的面积大于BP的ROC曲线下方的面积,说明SVM模型方法优于ANN方法。

图3.ROC曲线

5结论

本文的工作表明,支持向量机作为一种新的机器学习方法,构建中小企业信用评价模型较为准确实用,具有较强的泛化能力,从测试结果来看,其分类的准确性也优于人工神经网络方法,它克服了人工神经网络现有缺陷,如学习过程中收敛速度慢,网络性能差,可能存在局部极小值等问题。该方法有利于机器逐步学习,便于编制智能评价系统。适当选择核函数和设置参数、对中小企业信用评价的影响因素进一步分析和整理,更多地收集中小企业相关的数据进行训练,都将有助于提高其分类精度。如何调整支持向量机分类器的参数,使得在限定一类错误率的前提下使另一类的错误率达到最小也是我们下一步的工作。

(作者单位:特华博士后科研工作站)

“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文”