首页 > 范文大全 > 正文

基于BP神经网络的电信客户综合价值评价研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于BP神经网络的电信客户综合价值评价研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘 要] 本文从操作层面出发,提出了一个包括直接经济维度和社会网络维度的电信客户综合价值评价指标体系,并设计了一个基于bp神经网络电信客户综合价值评价模型。通过一个实际案例的分析,进一步地阐明了整个评价模型的数据获取、数据预处理、模型建立以及数据分析一整个流程的操作。

[关键词] 电信客户价值 客户价值评价 BP神经网络 社会网络分析

电信运营商在经历了十多年的分分合合之后,目前正逐渐由卖方市场向买方市场过渡,客户资源竞争,特别是价值客户竞争,已经成为电信运营商战略制定的新方向。因此,找出一个比较全面的方法对运营商所拥有的客户进行评价和分类,挖掘出其拥有的价值总量显得尤为重要。现有研究大多从直接经济维度出发,以各种可直接测量的经济指标作为客户价值评价的依据。但是信息手段的飞快演变带来的不仅是通信的便捷,还形成了一个更为复杂的客户关系网络,电信运营商作为信息交换的中枢,对客户关系网络的把握无论从硬件还是软件上,都具有明显的优势。在其网络中的客户所具有的价值不仅仅只是传统客户价值理论中所定义的“收入减成本”,更重要的是客户所拥有的社会网络价值。因此,本文提出了一个包括直接经济维度和社会网络维度的电信客户综合价值评价指标体系,并设计了一个基于BP神经网络的电信客户综合价值评价模型。通过一个实际案例的分析,进一步地阐明了整个评价模型的数据获取、数据预处理、模型建立以及数据分析一整个流程的操作。

一、电信客户综合价值评价指标体系

本文提出的电信客户综合价值评价指标体系包括直接经济维度和社会网络维度,具体来说:

1.直接经济维度包括当前价值类指标和潜在价值类指标:

(1)当前价值类指标,包括基本功能消费和附加功能消费两部分。

基本功能消费是指客户在电信运营商中交纳的基本通信费用,包含月租(X1)、本地话费(X2)、长途话费(X3)三个指标。基本功能消费是电信运营商能够给普通客户带来的最基本的服务,它是客户在正常消费服务的过程中给电信运营商带来的收益。

附加功能消费是指客户发送短信、使用GPRS以及其他增值服务产生的费用,为了方便此处用数据业务通信费(X4)一个指标统计。这些附加功能消费属于特殊功能,他们的使用能够使客户增加已购买产品的交易额。

(2)潜在价值类指标,主要通过考察客户的忠诚度和信用度来判定。

忠诚度用在网时长(X5)和当月通话时长(X6)来衡量。在网时长是指客户使用该电信运营商品牌的时间长度,在网时长数值越大表示客户对该品牌越依赖。当月通话时长是指客户当月使用该品牌进行通话的总时间长度,这个数值在一定程度上可以表征客户对该品牌所持态度的变化,如果每个月的“当月通话时长”数值趋于稳定,则忠诚度较高,反之依然。

信用度包括最高欠费金额(X7)、月欠费金额(X8)和欠费次数(X9)三个指标。最高欠费金额为客户在使用该品牌时欠费的最高值;月欠费金额是客户当月欠费的数值;欠费次数是客户使用该品牌中欠费的次数。这三个指标反映的是客户的经济承受能力,在一定程度上代表着其信用度。

2.社会网络维度包括三个指标:

点度数中心度(X10)、点中间中心度(X11)、点接近中心度(X12)三个指标是社会网络分析技术中的三个常见指标,所表征的客户社会网络属性各有侧重:点度数中心度表征的是客户在网络中“权利”的大小;点中间中心度表征的是客户在网络中“控制力”的大小;点接近中心度表征的是客户在网络中“反控制”的大小。而在电信客户的社会网络分析中,我们可以通过用户的通话清单计算出这三个指标值。

二、基于BP神经网络的电信客户综合价值评价模型

根据电信客户综合价值评价指标体系,客户经理就可以用技术手段来分析某个特定客户的综合价值了。但是在具体实施中,电信运营商面向的客户是多种多样的,几乎覆盖了所有的行业,设置一套指标权值一劳永逸是不现实的想法。针对此,本文提出了基于BP神经网络的电信客户综合价值评价模型,它能够根据不同地区、不同行业客户的特征,对历史数据进行学习,计算出权值配置的优化方案,大大提高客户综合价值的评价准确率。

1.数据获取

在理想情况下,处于电信运营商内部的客户经理可以从业务运营支撑系统中直接导出直接经济维度的指标X1~ X9,然后进行归一化处理,将各量级数值转化为无量纲、0~1间的数值。另外,X1~ X6是正向指标,即数值越大越优;X7~ X9是负向指标,即数值越小越优。在进行归一化处理时要将它们统一为正向指标,方便分析。

设:

其中,n表示客户样本总数;Tij表示第i个客户样本的第j项指标值;Tjb表示所有客户样本的第j项指标的最大值;Tjs表示所有客户的第j项指标的最小值。

那么,归一化后的客户样本正向指标值为:

归一化后的客户样本负向指标值为:

而对于社会网络维度指标X10~ X12的获得,需要客户经理通过业务运营支撑系统先导出目标客户群的通话记录数据,然后用社会网络分析软件Ucinet分析出每个客户样本的点度数中心度、点中间中心度和点接近中心度并做归一化处理,方法同上所述。

为了保障客户信息安全,保护客户隐私,电信运营商对业务运营支撑系统的管理十分严格,非内部职工是无法查询客户数据的。因本文作者不是电信运营商内部职工,无法拿到指标体系中所有的数据。为了能够收集到足够多的数据来进行模拟,本文采用网络问卷调查的方法,对本人所在单位正在使用某品牌的43人进行了访问,邀请他们通过登陆网上营业厅导出包括通话清单、月租、本地话费、长途话费、通话时长、数据业务通信费等在内的个人数据以作研究。而“在网时长X5”在网上营业厅是无法查到的,则需引导被访者回忆使用该品牌的大概时长。另外,在本次调查中被访者的信用度都非常良好,几乎没有出现欠费记录,为了达到降维、加快运算速度的目的,没有对X7~X9进行统计。最终,调查得到了37份有效数据。

2.数据预处理

(1)建立数据仓库

建一个名为“数据处理.xls”的Excel文档,作为数据仓库。在“数据处理.xls”中,新建“10月”、 “11月”、 “12月”、 “1月”、 “2月”五个工作表用于存放被访者对应月份的数据。其中,X1~X6可以从被访者原始数据表中得到,X10~X12用社会网络分析软件Ucinet计算求得,详细步骤如下:

① 根据被访者原始数据表,构建邻接矩阵:二者在本月内有通话记录记为1,否则记为0。

② 打开Ucinet,通过DataImport via spreadsheet(DL editor)Full matrix w/multiple sheets路径将邻接矩阵表导入软件。导入数据之后,Ucinet将在默认目录自动生成工程文件“邻接矩阵.##h”和“邻接矩阵.##d”。

③ 通过NetworkCentralityMultiple Mesures(old)路径打开工程文件“邻接矩阵.##h”,计算出各月份每个被访者的点度数中心度(Degree)、点中间中心度(Betweenness)和点接近中心度(Closeness)。并通过VisualizeNetDraw路径得到网络关系图。

(2)归一化处理

在“数据处理.xls”中新建“10月归一化”、“11月归一化”、“12月归一化”、“1月归一化”、“2月归一化”五个工作表用于存放被访者对应月份的归一化数据,并在对应月份的单元格中算出归一化数值。例如,“10月归一化”工作表中C3单元格的归一化公式为“='10月 '!C3/MAX('10月 '!C$3:C$39)”,它表示用“10月”工作表中C3单元格的数值除以C3至C39单元格中的最大值。

这样,我们就得到了预处理完毕的五个月数据,接下来进行BP神经网络的建模。

3.评价模型神经网络的确立

(1)输入向量、输出向量维数确定

输入向量为指标X1~X6以及X10~X12共9个维,每个月的输入向量是一个9×37的矩阵。输出向量为一个确定的数值,因此维数为1,而每个月的输出向量是一个1×9的矩阵。

(2)隐层节点数的确定

根据现有文献经验,设m、n、h分别表示输入向量维数、输出向量维数以及隐层节点数,则在m>n时, 为最佳隐层节点数选择区间。因此,本研究的最佳隐层节点数区间为[4~13]。通过在MATLAB中进行仿真模拟比较,确定最佳隐层节点数为9。因此,本研究最终的神经网络结构为[9,9,1]。

(3)传递函数确定

由于S型非线性函数的网络具有较强的分类能力,它也接近于人脑神经元的输入输出特性,神经元采用S型非线性函数,对于隐层神经元,我们取传递函数为tansig函数,函数表达式为:。而我们的输出层需要在区间[1,5]进行评分取值,因此用purelin函数,函数表达式为:。

(4)学习算法确定

根据现有文献研究,在进行中小规模数据处理时,LM算法的收敛速度最快,而且精度也比其他算法高,能够获得更小的均方差。因此,本研究采用LM算法作为神经网络的学习算法。

4.评价模型在MATLAB上的训练及仿真

因为9个指标都是正向指标,因此整个评价模型应该是递增函数。我们将预处理后的数据进行分类,按数值大小分为“很高(0.8~1)、高(0.6~0.8)、一般(0.4~0.6)、低(0.2~0.4)、很低(0~0.2)”五级,那么可以知道:当9个指标都取最大值1时,评价值最高,其他等级亦是如此。设期望评价值为区间[1,5]上的实数,那么用于评价模型学习训练的输入向量p和输出向量t分别为:

将p、t导入MATLAB,并编写训练程序:

经过5次迭代,网络停止了训练,训练均方误差下降到

,而测试均方误差和确认均方误差在第2次迭代时达到一致的0.011898,如图1所示。说明建立的神经网络可以被接受。

图1 误差曲线

网络训练完成后,我们将预处理好的数据按月份导入MATLAB。设x2、x1、x12、x11、x10和y2、y1、y12、y11、y10分别为2月、1月、12月、11月、10月的输入向量和输出向量,则有程序:

这样,我们就得到了各月份各客户的综合评价值。在Excel中根据综合评价值按月份做出圆环图,如图2所示,自圆心向外的五个环依次为10月、11月、12月、1月、2月的评价值数据,每个色块代表每个客户的综合评价值占当月总分值的比重。

图2 客户综合价值圆环图

由圆环图我们可以看出:

(1)每个月各色块所占比重是相对稳定的,这说明本研究的客户群体的消费习惯趋于稳定,整体离网概率较低。从另一个角度看,客户经理每个月查看该图,就能知道目标群体中是否有异常数据,及时做离网预警分析。

(2)五个月内编号为9的客户综合评价值最高。从归一化表中可以查到,尽管其直接经济维度各指标值并不是最高,但是其社会网络维度指标值每个月都排在前列,这说明她在此研究群体中比别人有更大的影响力。而考察实际的客户身份可知,9号客户是单位办公室主任,负责单位的内外部人员联系,传达领导指示,分派具体任务。据观察分析,因为该客户的主要联系方式是单位的固定电话,移动通话的频率相对没有那么高,所以其直接经济维度价值被掩埋了。如果只分析其直接经济维度指标,是不能将其客户价值真正挖掘出来了。而采用本文提出的电信客户综合价值评价指标体系进行分析的话,就能通过社会网络维度的指标值,挖掘出了其隐藏着的社会关系属性,纠正了对其客户价值的评价。这也验证了该指标体系的有效性和实用性。而从另一角度来看,客户经理在分析数据时,如果发现某个客户的直接经济维度数值不高但社会网络维度数值较高,就应该引起重视,因为其很有可能担当着目标群体内部“上传下达”的角色,客户经理应该优先发展该类型的客户,将更多的优惠资源投放于此,以把握住该目标群体的“关系核心”所在,从而方便地将营销网络由中心向周边扩散。

(3)五个月内编号为27的客户综合评价值排名第二。从归一化表中可以查到,其直接经济维度和社会网络维度各指标值都排在前列,说明其是优质价值客户,这类型客户不仅对公司保有足够的忠诚,而且其在目标群体中属于活跃分子,具有较大的概率愿意为公司做业务推广传播,加强口碑效应。客户经理对该类型客户应该多加培养感情,提高其业务满意度,将其作为新业务推广的原点,向外扩张。

(4)观察到编号为26的客户综合评价值虽然较高,但是通过分析归一化表发现,社会网络维度指标数值较低,说明其在此目标群体中的“认同度”不高,即在此群体中不活跃。但是从归一化表中又能发现,其直接经济维度指标数值还是比较高的,这表明该客户在另外的群体中是个优质价值客户。这表明本评价模型能很好地平衡了直接经济维度和社会网络维度各指标间的权值设置。而从另一角度来看,客户经理在分析数据时,如果发现某个客户的直接经济维度指标值较高而社会网络维度指标值较低,可以尝试去挖掘一下其所属的别的活跃圈子,因为该类型客户往往就是其活跃圈子中的关系网络核心人物,客户经理可以通过他拓展出一个新的业务营销群体。

三、结论

本文提出的电信客户综合价值评价指标体系比较全面地考虑了直接经济维度和社会网络维度两方面,并据此设计了基于BP神经网络的电信客户综合价值评价模型,经过实际案例的分析,具有较高的可信度和较强的实际操作意义,为客户经理、研究人员进行相关的分析研究提供了一个可参考的技术框架。

参考文献:

[1] 齐佳音,舒华英.客户价值评价、建模及决策[M].北京:北京邮电大学出版社.2005

[2] 王艳辉,吴斌,王柏.电信社群网络静态几何性质分析研究[J].复杂系统与复杂性科学,2005(02)

[3] 严寒冰.人工神经网络在电信业客户关系管理中的应用研究[D].重庆大学,2007

[4] 刘军.社会网络分析导论[M].北京:社会科学文献出版社.2004.12

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文