首页 > 范文大全 > 正文

数据挖掘中客户的特征化及其划分

开篇:润墨网以专业的文秘视角,为您筛选了一篇数据挖掘中客户的特征化及其划分范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要] 良好客户关系已成为电子商务时代制胜的关键。在激烈的市场竞争中,客户关系管理逐渐成为企业关注的焦点。深入研究客户和潜在客户是在市场中保持竞争力的关键。本文通过对客户行为的特征化分析,以数据挖掘为分析工具,对客户关系管理进行了讨论,给出了相应的划分方法,使用这些划分方法,对客户进行分析是有意义的。

[关键词] 客户关系管理 数据挖掘 聚类分析

一、引言

在激烈的市场竞争中,客户关系管理(Customer Relationship Management)逐渐成为各企业关注的焦点。一个成熟的CRM 系统要能够有效地获取客户的各种信息,识别客户与企业间的关系及所有交互操作,寻找其中的规律,为客户提供个性化的服务,为企业决策提供支持。

在企业与客户的交互操作中,“二八原则”是值得借鉴的,即20%的客户对企业做出80%的利润贡献。但究竟谁是那20%的客户?又如何确定特定消费群体的消费习惯与消费倾向,进而推断出相应消费群体或个体下一步的消费行为?这都是企业需要认真研究的问题。

二、客户的特征及其划分

企业认识客户和潜在客户是在市场保持竞争力的关键。特征分析是了解客户和潜在客户的极好方法,包括对感兴趣对象范围进行一般特征的度量。一旦知道带来最大利润客户的特征和行为,就可以直接将其应用到寻找潜在客户之中。有效寻找客户,认识哪些人群像自己的客户。因此,在争取客户的活动中,对感兴趣对象进行特征化及其划分是很有意义的。

对客户的特征化,顾名思义就是用数据来描述或给出客户(潜在客户)特征的活动。特征化可以在数据库(或数据库的不同部分)上进行。这些不同部分也称为划分,通常他们互不包含。

划分分析(Segmentation Analysis)通常用于根据利润和市场潜力划分客户。如:零售商按客户在所有零售商店的总体购买行为,将客户划分为若干描述他们各自购买行为的区域,这样零售商可以评估哪些客户有最大利润。划分是把数据库分成互不相交部分或分区的活动。一般有两种方法:市场驱动法和数据驱动法。市场驱动法需要决定那些对业务有重要影响的特征,即需要预先选择一些特征变量(属性),以最终定义得到划分。数据驱动法是利用数据挖掘中的聚类技术或要素分析技术寻找同质群体。

三、数据挖掘的概念

数据挖掘(Data Mining)是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。通过数据挖掘提取的知识表示为概念、规则、规律、模式等,它对企业的趋势预测和行为决策提供支持。

1.分类分析

分类是指将数据映射到预先定义好的群组或类。分类要求基于数据属性值来定义类别,通过数据特征来描述类别。根据它与预先定义好的类别相似度,划分到某一类中去。分类的主要应用是导出数据的分类模型,然后使用模型预测。

2.聚类分析

聚类是对抽象样本集合分组的过程。与分类不同之处在于聚类操作要划分的类是事先未知。按照同一类中对象之间较高相似度原则进行划分,目的是使同一类别个体之间距离尽可能小,不同类别中个体间距离尽可能大。类的形成是由数据驱动的。

3.关联规则

关联规则是从大量的数据中挖掘出有价值的描述数据项之间相互关联的知识。关联规则中有两个重要概念:支持度(Support)和信任度(Confidence)。它们是两个度量有关规则的方法,描述了被挖掘出规则的有用性和确定性。关联规则挖掘,希望发现事务数据库中数据项之间的关联,这些规则往往能反映客户的购买行为模式。

4.时间序列分析

时间序列分析是通过对过去历史行为的客观记录分析,揭示其内在的规律,预测未来行为。它旨在从大量的时间序列中提取人们事先不知道的,但又是潜在有用的、与时间属性相关的信息和知识。

5.孤立点分析

数据库中包含那些不符合大多数数据对象所构成规律(模型)的数据对象,称为孤立点。对孤立点挖掘分析可以处理一些特殊事件。

6.回归分析

在掌握大量观察数据的基础上,利用数理统计方法,建立因变量与自变量之间的回归关系函数。回归分析法是定量预测方法之一,它依据事物内部因素变化的因果关系来预测事物的发展趋势。

四、数据挖掘在CRM中的应用

1.对客户的相关属性分析

(1)挖掘客户的特性

DM的第一步就是识别客户群,挖掘客户特性,如:了解客户地址、年龄、性别、收入、教育程度、爱好等基本信息,还有健康、嗜好、配偶、家庭环境等特征信息,发现其行为规律,制定吸引客户的策略。

运用分类与聚类方法,从客户基本库中发现不同的客户群,用购买模式刻画不同客户群的特征,针对不同类型的客户,提供个性化的服务。

(2)客户行为分析

①客户满意度

客户满意度分析是对其产品或服务的消费经验总体评价,应用数据挖掘分析方法可以从零散客户反馈的信息中,分析客户的满意度,找出客户不满意原因。

②客户忠诚度

客户忠诚度是指客户愿意继续购买该企业产品或服务的倾向。以客户的购买倾向为度,对客户数据分析,对高忠诚度的客户继续保持,对低忠诚度的客户要下功夫将其培养成高忠诚度客户。利用分类、聚类方法将客户分为不同客户群,并从中确定那20% 的对企业有80% 贡献率的最有价值的客户群,对不同价值贡献率客户采取不同策略和措施。

③客户保持

保持客户的同时不断挖掘潜在客户,是企业持续发展的重要手段。通过数据挖掘的决策树、神经网络等方法建立预测模型,识别潜在客户。还可以通过客户盈利能力分析,帮助企业制定市场策略,留住有价值的客户,开发潜在客户。用聚类(分类)和关联分析,发现有价值稳定的客户群,有价值易流失的客户群,低价值稳定的客户群和低价值不稳定的客户群,采取不同的服务(推销)和价格策略稳定有价值客户,转化低价值客户。

④客户跟踪服务

对客户的变动要及时跟踪分析客户变动原因,防止客户群体的流失,指导企业合理配置资源,为客户提供“一对一”个性化服务,以抓住现有客户并吸引潜在客户。

⑤客户生命周期价值

基于客户生活方式和购买行为建立客户分群,计算不同客户分群的生命周期价值,设计差异化的沟通策略。分析客户不同时期收入、成本、风险,利用价值理论公式得出客户的价值并提供预测。数据挖掘技术分析和预测不同市场活动情况下客户盈利能力的变化,帮助企业制定市场策略。

⑥交叉销售

分析客户消费记录,发现潜在交叉购买需求,选择最合适的交叉销售形式。数据挖掘可寻找那些影响客户购买行为的因素,挖掘隐藏在数据间的表面看似独立事件间的相互关系。如发现“90% 的顾客在一次购买活动中购买A 商品的同时购买B 商品”之类的知识,展开交叉营销。

⑦异常分析

异常事件在商业领域中往往具有显著价值,如:金融欺诈、客户流失等。通过数据挖掘中的偏差分析可以迅速准确地找到异常事件,制定相应的营销策略。客户流失是异常情况之一,根据以前的客户流失数据,包括:客户属性、服务属性、消费属性与流失可能性关联的数学模型,找出客户流失原因,建立预测模型推测现有客户的流失情况。

2.市场分析

预测不同区域消费者对不同产品的消费趋势、季节变化、非规则变化等。采用时序分析方法,对基于时间序列销售数据进行趋势分析,预测市场的趋势变化、循环变化、季节性变化、非规则或随机变化。通过对客户关系管理系统分析,可有效地指导企业在市场、销售、服务等方面将资源分配给有价值的客户,掌握客户的行为模式,以应对各种客户行为以及市场变化。

3.市场划分方法

依据客户消费习惯、收入、偏好、购买频率等因素将客户分类,使同一细分市场里的客户具有相似偏好和需求。在市场划分前,先做好如下工作:定义业务目标,构建市场划分团队,检查和评估数据需求,选择恰当的分析层次,在客户群体中选择好用于分析的样本,从指定的数据源为样本抽取数据,清理数据,然后选择恰当的划分方法。

(1)预定义划分方法

分析人员根据已有经验分析市场,分析各个变量和数据,然后决定划分市场。使用不活跃交易群体,可能流失客户群体和潜在信用使用群体等进行市场划分。恰当的市场划分取决于商业目标和对客户的了解程度。

(2)统计划分方法

在客户划分数目太多或对目标群体不是很了解时采用,这种方法是利用各种数据统计技术划分客户。开展新客户工作或对当前客户所知甚少时,采用此方法。

(3)复合划分方法

综合采用预定义划分和统计划分方法,具体采用何种顺序取决于对客户群体的了解。综合使用两种方法能够敏锐地洞察客户群体。

应用合适的划分方法,需要看划分效果如何?看这样划分与业务目标是否相关,是否可理解和容易特征化。这种评估分析可以通过定性和定量两个步骤,分析的内容主要是判断同一个划分内的客户是否类似(特征、频度分布),每个客户划分是否与其他客户划分都不相同,每个客户划分是否都有与之对应的面向业务目标与策略。

对潜在客户的挖掘,往往是在“信息不对称”情况下做出的决策,这种决策不可避免带有人为因素。因为一般是利用可行(成熟、廉价、易得) 的技术、手段来减少信息的不确定性与不对称性。这种情况下无法对客户作全面了解和测评,所得出的结论往往带有个性化因素,有可能漏掉部分重要客户。

4.聚类分析以发现客户划分

聚类分析是将数据(样本)分割成具有相似特性的群体以实现划分。在聚类分析中,衡量不同数据在属性上的相似性主要有两种方法:距离与相关系数。数据之间相似性的程度高低,可以通过数据在空间分布之间的距离衡量其相似性。数据之间的相似性还可以通过在不同变量之间的关联程度来反映。相关系数主要用于衡量不同变量之间的协同程度,即一个变量变化与另一个变量变化之间的关系。使用距离或相关系数法,把特征上相似的观察数据值聚在一起,试图把相异的观察数据分开,以实现分类划分。聚类分析所形成的结果是一个聚类模型,分析人员可根据聚类模型,研究不同类别在各个变量上的特性,形成一组类别划分规则。

五、结论

客户的特征化及其划分是数据挖掘最直接、最简单而有效的应用。准确掌握顾客的消费偏好改变,对潜在客户群体建立响应模型,适时提供客户所需要的服务与信息,维持与掌握客户的满意度,有效利用数据挖掘结果做决策。但数据挖掘不是万能的,在实际应用中还要受到许多条件限制。要有足够合适的数据,选择恰当的模型和算法,有决策者的支持等都是有效应用数据挖掘技术的必要条件。

参考文献:

[1]Olivia Parr Rud著 朱杨勇等译:数据挖掘实践[M].北京:机械工业出版社,2003

[2]Jiawei Han,Micheline Kamber著 范明等译:数据挖掘:概念与技术[M].北京:机械工业出版社,2001

[3]刘友军 吴 建:数据挖掘在CRM中的应用研究[J].商场现代化,2007(35),37~38

[4]夏维力 王 鑫 王青松:数据挖掘技术在企业客户关系管理中的应用研究[J].科技管理研究,2007(6),196~198