首页 > 范文大全 > 正文

基于BP神经网络的信用卡违约风险预测

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于BP神经网络的信用卡违约风险预测范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:利用BP(Back Propagation)神经网络模型实现信用卡申请人自然信息对违约风险预测,确定了违约风险的指标体系,通过对小样本数据的训练和仿真,实现了模型输出与目标输出的高度吻合。

关键词:信用卡;违约风险;BP;神经网络;预测;

中图分类号:TP183文献标识码:A文章编号:1009-3044(2011)10-2348-02

The prediction of the Default Risk of Credit Card Based on BP Neural Network

FAN Wei-qiang1, LIU Tun-dong2

(1.73118 PLA Troops, Xiamen 361024, China; 2.The Automation Department, Information Science & Technology, Xiamen University, Xiamen 361005, China)

Abstract: After implementation of prediction of risk of default from natural information of credit card applicants using BP (Back Propagation) neural network, the default risk of the index system is established.Through the training and simulation on small sample data, highly approximation between the model output and target output is achieved.

Key words: credit card; default risk; bp; neural network; prediction

目前,对于违约风险,银行往往是利用传统的“评分系统”或者所谓“专家评分”来确定申请者风险水平。这种传统的评分方法,有很大的随意性和不稳定性。BP神经网络,在经济领域已有广泛的应用[2-3],然而,在信用卡风险预测方面尚不多见,本文以三层BP网络为基础实现信用卡风险预测。银行根据风险水平进一步确定是否发卡及透支额度。

1 信用卡违约风险

1.1 信用卡违约风险概述[4]

信用卡违约风险是由持卡人做出部分或全部支付的承诺时潜在的支付失败驱动的,它在持卡人在还款期限内出现资金紧张或不愿意偿还时发生。

1.2 信用卡违约风险预测指标确定

根据银行专家在个人信用体系构建方面的研究成果[5],确立本预测模型的三个指标变量:个人特征,经济状况和信用记录,每个变量又具体包含更细的指标要素。其中个人特征包括年龄(u1)、婚否(u2)、工作稳定状况(u3)及受教育程度(u4);经济状况包括本人月收入(u5)、家庭月收入(u6)、金融资产(u7)及固定资产状况(u8);信用记录包括是否有不良信用记录(u9)、抵押资产(u10)及贷存比(u11)。

2 BP神经网络基本算法

2.1 神经网络BP算法原理

BP算法的主要设计思想是,将输入信号通过隐层和输出层节点的处理计算得到的网络实际输出进一步与期望输出相比较,并计算实际输出与期望输出的误差,将误差作为修改权值的依据反向传播至输入层,再修正各层的权系数,并且反复这一过程,直到实际输出与期望输出的误差达到预先设定的误差收敛标准,从而获得最终的网络权值。BP神经网络听拓扑结构如图1所示:图1中,X1,X2,…,Xn是BP神经网络的输入值,Y1,Y2,…,Ym是BP神经网络的预测值,ωij和ωjk为BP神经网络权值。从图1可以看出,BP神经网络可以看成一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量。当输入节点数为n,输出节点数为m时,BP神经网络就表达了从n个自变量到m个因变量的函数映射关系。

2.2 BP神经网络的训练步骤

1) 网络初始化。根据系统输入输出序列(X,Y)确定网络输入层节点数n、隐含层节点数l,输出层节点数m,初始化输入层、隐含层和输出层神经元之间的连接权值ωij和ωjk,初始化隐含层阈值a,输出层阈值b,给定学习速率和神经元激励函数。

2) 隐含层输出计算。根据输入X,输入层和隐含层间连接权值ωij以及隐含层阈值a,计算隐含层输出H。

(1)

式中,l为隐含层节点数;f为隐含层激励函数,该函数有多种表达形式,本文中选择tansig函数,其表达式为:

(2)

3) 输出层输出计算。根据隐含层输出H,连接权值ωjk和阈值b,计算BP神经预测输出O。

(3)

4) 误差计算。根据网络预测输出O和期望输出Y,计算网络预测误差e。

(4)

5) 权值更新。根据网络预测误差e更新网络连接权值ωij和ωjk。

(5)

(6)

6) 阈值更新。根据网络预测误差e更新网络节点阈值a,b。

(7)

(8)

7) 判断算法迭代是否结束,若没有结束,返回步骤(2)。

3 信用卡违约风险预测模型构建及Matlab仿真

3.1 选取训练样本与测试样本

本文使用一个小样本数据集[6]来对其应用情况进行介绍。样本 1~20 为训练样本 , 其中前12个为未违约样本(即按时还款,记为Y) , 后8个为违约样本 (即未按时还款,记为N); 样本21~23为测试样本。对于样本各项指标的特征 ,采用评分的方法给出。

3.2 模型有关参数的设定

BP神经网络构建根据系统输入输出数据特点确定BP神经网络的结构,由于信用卡违约风险预测指标数为11,取输入层神经元数为11;输出层采用线形(purelin)激励函数,神经元数为1;隐含层神经元数根据经验公式[6]l

3.3 信用卡违约风险预测仿真

通过Matlab R2008a软件验证模型的泛化能力。选取表1中前20组样本数据作为训练数据,后3组的样本数据作为检验数据,对经过训练生成的神经网络模型的预测结果进行验证。

从图2以看出,误差曲线从2.50开始变化 ,经过781次学习训练后基本达到期望的误差精度0.01。图3反映了目标输出与模型输出的吻合程度,其中前20个样本是训练样本,后三个样本为检验样本,表1显示了检验样本的预测结果。

4 结论

本文运用BP神经网络模型实现了信用卡违约风险预测,预测值与实际值吻合程度高,并具有很强的泛化能力。由于只是通过训练得出输入输出之间联系,得出预测结果,弱化了主观因素对预测的影响,方便进行批量客户处理。但是当出现奇异数据时(样本7、15)BP算法预测误差变大,此外,神经网络的“黑箱”性质,使预测过程不够透明,各指标对结果的影响因子较其他方法更难解释。

参考文献:

[1] 中国人民银行.2010年支付体系运行总体情况[EB/OL].(2011-02-01)./gzdt.

[2] 甘昕艳,张钰玲,潘家英.基于股价指数预测的仿真研究[J].计算机仿真,2010(10):297-300.

[3] 朱新玲,黎鹏. 基于bp 神经网络的人民币汇率拟合与预测研究基于股价指数预测的仿真研究[J].中南民族大学学报:自然科学版,2010(3):113-120.

[4] 安哥拉•阿万涅提斯,约•葛列格里.信用产品全面指南[M].金雪军,等,译.天津:南开大学出版社,2004.

[5] 熊其康.加快我国个人征信业发展的思考[J].金融理论与实践,2004(12):22-24.

[6] 姜明辉,王雅林,赵欣,黄伟平.K-近邻判别分析法在个人信用评估中的应用[J].数量经济技术经济研究,2004(2):143-147.

[7] 焦淑华,夏冰,徐海静,刘莹.BP神经网络预测的 MATLAB实现[J].哈尔滨金融高等专科学校学报,2009(1):55-56.