首页 > 范文大全 > 正文

基于人工神经网络的银行客户流失分析模型

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于人工神经网络的银行客户流失分析模型范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:针对目前中国建设银行存在的客户流失问题,利用BP人工神经网络网络稳定、学习能力强的特点,通过输入变量和输出变量之间的相关性分析,建立银行客户流失分析模型,以此获取即将流失的客户,以便银行做出经营决策,挽留有关用户,确保银行效益不受影响。实验证明,此模型能够很好的对银行客户流失进行预测分析。

关键词:相关性分析;客户流失;人工神经网络

中图分类号:TP183文献标识码:A文章编号:1009-3044(2012)03-0665-03

The Analysis Model of the Bank Customer Churn Based on Artificial Neural Network

LIN Rui1,2, CHI Xue-zhi3

(1. China Construction Bank, Dongying 257000, China; 2. China University of Petroleum, Dongying 257000, China; 3. Shandong Police College, Jinan 250014, China)

Abstract: For the current customer churn problem of China Construction Bank, using the BP neural network network stability, good learning ability characteristics, through the correlation analysis between the input variables and output variables,establish a bank customer churn analysis model, through this model we can access to the data of customer’s loss, so that the bank make business decisions, retain the user to ensure that bank efficiency is not affected. Experiments show that this model can well predict the loss of bank customers.

Key words: correlation analysis; customer’s loss; artificial neural network

随着国际金融一体化和网络经济的发展,我国商业银行面临更加激烈的市场竞争,如何有效的应对竞争,抓住给银行带来效益的客户资源,提高中国建设银行的市场份额,增加企业的效益,成为摆在中国建设银行面前的重要课题。但是,国内许多银行往往把精力放在发展新客户上,而对于现有客户的需求没有进行深入分析,以致造成现有客户的流失。因此,如何对银行客户流失进行有效的分析,针对不同的客户实行差别化服务,满足客户的不同需求,避免客户的流失,这样可以大大地提高银行的竞争力。本文利用人工神经网络的鲁棒性和容错性、能够处理负责的非线性关系、可学习和自适应能力强的特点,通过对保留在银行数据库中的客户数据进行分析,建立客户流失模型,预测客户流失情况,从而帮准银行调整服务和经营策略,给银行带来更大的效益。

1客户流失分析

TNS日前首份中国银行业调查报告,该公司北京、上海、广州三地,对1500名零售银行客户以及900名信用卡用户进行调研,分析显示目前中国银行业客户维系指数低于全球平均水平,调查也显示目前国有商业银行的客户流失率高达30%。银行客户流失的原因有很多,客户信息中的哪些关键因素会导致客户的流失,面对客户的流失银行应该采取怎样的应对措施成为银行需要重点关注的问题。为此,银行需要建立客户流失分析模型,作用有两个方面:

1)通过对客户数据的分析,获取客户信息中的关键因素和客户流失之间的必然关系,从而有针对性的改变银行的经营和服务策略。

2)对可能流失的客户进行预警。

目前的相关研究中,典型的客户流失分析主要有分类回归树、决策树、C4.5、偏差统计等方法。但是勋在精确度低,客户特征之间的相互影响的关系难于表达,对噪音数据非常敏感等问题,使用这些方法建立的客户流失分析模型往往比较负责,达不到对客户进行流失分析的需要。

2基于BP人工神经网络的客户流失分析模型

2.1在客户流失分析中应用BP人工神经网络

BP(Back Propagation)人工神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。由于BP人工神经网络具有自适应和学习能力强的特点,我们将它引入客户流失分析中,通过对与获得样本数据的训练和学习,确定客户流失分析的基本模型,通过模型一方面可获得银行客户的基本特征信息与客户流失之间的必然联系,另一方面也可以对现有客户是否流失进行预警,从而达到挽留即将流失客户的目的。

在客户流失分析中应用BP人工神经网络,作者对以下4个方面进行了重点考虑:

1)关键属性变量的选取

2)特征数据预处理

3)基于BP网络的客户分析模型的建立4)BP人工神经网络的训练

2.2关键属性变量的选取

为得到更为准确的客户流失分析模型,首先要收集高质量的训练用银行客户样本。本文从中国建设银行xx分行数据库中获取6个月的客户数据作为样本,数据包括这家银行客户的基本信息特征和行为特征。全部客户样本共4412个,其中撤销账户的有167个,保持开户的有4245个。

从提取的资料来看,字段变量非常复杂,共58个字段变量,为适应BP人工神经网络对数据数据的要求,减少网络复杂度,首先对这些变量的进行相关性分析,去除对客户流失分析模型无用或意义不大的变量,并且归约派生有用的新变量。根据现有国际上对客户流失影响因素的研究和领域专家对客户数据的分析,最终确定影响中国建设银行客户流失的关键变量有10个,显示在表1中。

表1影响客户流失的关键变量及代码

2

.3数据预处理

在客户样本数据应用于人工神经网络测试和训练之前,要对所取得的数据进行量化处理以满足BP神经网络学习的需要,需要量化的是关键属性变量输入和某一样本的期望输出。

由于存在多个关键属性变量,各个属性变量之间存在着不可公度性和矛盾性,各属性变量的量纲、数量级和指标类型也不尽相同。为了消除这种差异对预测结果的影响,在评价时首先要将训练样本的向量归一化,使网络的训练样本的值都在[0,1]范围内,从而网络的性能会发挥得更好。笔者采用最大最小函数法对原始输入进行预处理,得到BP神经网络输入层输入节点的初始值为{ci1,ci2,?,cin},期望输出的值0或1,如果样本数据中客户没有流失,输出为0,否则为1。假设有m篇样本,则BP神经网络的输入层数据为:

2.4模型的建立

建立一个人工神经网络模型,该模型包括10个输入单元,1个输出单元。由于BP人工神经网络具有的最大特点就是非线性函数的逼近,而且只含有一个隐藏层的BP网络即可完成此任务,因此,采用一个隐藏层。输入层节点的个数为前面取得的影响客户流失的关键属性变量数目;隐含层节点数目根据具体情况在实验过程中确定,一般不少于输入层节点的个数;由于神经网络最终的输出结果为计算出的客户流失度的大小,因此,输出层节点在本文中设计了一个。

根据模型中输入层数据的取值范围,模型中在每个隐含节点和输出节点的值都是用Sigmoid转移函数(f( ) x = 1+e-x)计算获得。基于BP人工神经网络的客户流失分析模型的基本结构如图1。

2.5 BP人工神经网络训练过程

为了对BP人工神经网络进行训练,我们将选取的4412个样本分为两类,其中,70%的用于训练,其余30%用于测试。这样分别构成了三个样本输入矩阵I3088×100和三个期望输出矩阵O3088×1。接着,初始化BP人工神经网络的结构,主要是确定了隐含层节点 的个数16。

BP人工神经网络的一般训练过程如下[4]:

假设第k-1层有n个神经元,对于第k层的第i个神经元,则有n个权系数wi1,wi2,......win,另外取多一个win+1用于表示阈值θi;并且对第k-1层的输出Xk-1取Xk-1=(X1k-1,X2k-1,......Xnk-1,1),多出的一个神经元称为偏置神经元。

算法的执行步骤如下:

1)对输入层权系数Wij置初值

首次学习时输入层的权系数Wij取一个较小的非零随机数,以后学习时为加快学习速度,Wij取以前网络学习收敛时的稳定权值。另外取Win+1=-θi

2)输入一个样本X1=(X11,X21,???,Xn1,1),以及对应期望输出Y=(Y1,Y2,???,Yn,Y0)。

3)计算各层的输出

对于第k层第i个神经单元的输出Xik,有:

4)求各层的学习误差dik对于输入层有k=m,有

对于其它隐含层,有

5)修正权系数Wij

使用一般化的Delta法则公式

及其修正公式

6)当求出各层各个权系数之后,可按给定条件判别是否满足要求。如果满足要求,则算法结束;否则返回3执行。

3训练结果及模型评价

3.1训练结果

我们对上述模型进行训练,最后样本在循环了528,630次达到收敛,证明可以使用该网络模型对客户流失进行预测分析。

3.2模型评价

客户流失模型要求两个方面的准确率:一个是预测准确率,一个是预测覆盖率,对模型的评价可以用如表2所示的评价矩阵表示。

表2客户流失评价矩阵

其中:

预测准确度: 预测覆盖率:

C+D

根据中国建设银行的运营要求,将预测覆盖率设定为80%以上,预测命中率设定在75%以上。

使用前面测试样本的1324条数据作为测试数据,对建立的客户流失模型进行评估,结果如表3所示。

表3评估结果

从模型评估结果可以看出,模型的预测命中率为84.58%;预测覆盖率为81.17%。从中国建设银行对客户流失分析模型的需求来看,模型已达到了要求,可以投入使用。将需要检测的样本通过BP人工神经网络训练,就可以得到每个样本所对应的客户是否有较大可能流失,然后,银行就可以有的放矢地采取必要措施来挽留客户。

4结束语

本文将人工神经网络技术应用于银行客户流失分析,建立了基于人工神经网络的客户流失分析模型,并对模型中的关键问题:关键属性变量的选取、数据预处理、流失模型建立、人工神经网络的训练过程等进行了重点研究,测试结果表明运用此模型对银行客户进行流失预测分析是可行的。它使得银行决策者能够及时了解客户流失情况发生,制定相应经营决策,挽留有关用户,确保银行效益不受影响。

参考文献:

[1]张云涛,龚玲.数据挖掘原理与技术.[M].北京:电子工业出版社,2004.

[2]郭明,郑惠莉,卢毓伟.基于贝叶斯网络的客户流失分析[J].南京邮电大学学报:自然科学版,2005,25(5):79-83.

[3]叶进,程泽凯,林士敏.基于贝叶斯网络的电信客户流失预测分析[J].计算机工程与应用,2005(14):212-214.

[4]迟学芝,朱晓丽,赵志刚.基于BP人工神经网络的信息过滤技术研究[J].电脑开发与应用,2007(6).