K―means 算法在物流快递企业客户细分中的应用(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇K―means 算法在物流快递企业客户细分中的应用范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

[摘要]面对日益激烈的物流市场竞争和信息技术的迅猛发展，物流快递企业必须建立以“客户为中心”的服务模式，针对不同的客户需求制定对应的营销策略和价格策略，并进行分类管理。数据挖掘中的K-means聚类算法能对大型数据集进行高效分类，改进的K-means算法能够应用于复杂的物流客户关系管理，对客户进行准确和全面的分类管理。

[关键词]物流 CRM；客户分类；数据挖掘；K-means聚类分析算法

[DOI]10.13939/ki.zgsc.2016.36.033

1 引言

数据挖掘（Data Mining）是从大量不完全的、模糊有噪声的、随机的实际应用数据中，提取隐含在其中的、潜在有用的、而且事先不不为人知的信息和知识的过程。[1]数据挖掘研究伴随着计算机应用技术的发展出现多种可供选择的方法，聚类作为最基本的数据挖掘方法，不仅可以独立地应用，还可以应用于其他数据挖掘方法的前期处理工作。当前运用最为广泛、最成熟的聚类方法就是均值聚类算法。K-means算法能有效地处理大规模和高维的数据集合。改进后的K-means算法通过处理复杂的物流客户管理中的非数值数据获取更加准确和全面的客户分类。

2 物流快递客户关系管理现状分析

随着我国电子商务和物流快递业的快速发展，国内物流快递市场的运行环境发生了较大的变化，目前国内物流正面对一个全面开放的、国际国内全方位充分竞争的市场环境。物流快递企业意识到在充分竞争的商业时代，企业必须通过占有更多优势资源，拥有大量有效客户，提供最佳客户服务，提升原有客户体验，进而增强客户的忠诚度和满意度。企业必须通过实现客户价值来扩大自身的盈利，通过信息化管理来替代原有的传统管理手段。

因此，物流快递企业需要快速获取尽可能详细的客户需求信息，通过数据挖掘和分析来认知客户的行为和偏好，进而分析客户消费模式及习惯的变化的规律，提升自身的市场洞察能力。如何通过企业和客户的信息交流平台，提供个性化的物流方案，有效的管理客户，深层分析大量客户信息的数据仓库获取提高企业市场竞争力的有效信息。有效数据挖掘技术就是从海量数据中挖掘出对企业有价值的潜在信息，从而支持客户关系分类管理的科学实现，满足现代充分竞争时代的企业需求与社会挑战。

3 物流快递客户关系管理

客户关系管理是一种改善企业与客户之间关系的新型管理方法，企业通过的交流和沟通理解客户，进而影响客户行为，最终长期获取客户、保留忠诚客户和创造更多利润。

客户细分是客户关系管理的重要组成部分，是企业客户关系管理的重要工具和关键环节。客户管理学中的二八法则表明，20%的客户创造企业80%的利润，即相对较多利润是由相对较少的大客户创造的。因此，企业要坚持与高价值客户的维持良好的业务关系，同时注意发掘潜在价值的客户，合理使用自有资源，提供有差别的个，才能在激烈的市场竞争中立于不败之地。

物流快递企业凭借自己独特的客户特性与市场特性为社会提供快递业务服务。物流快递企业有着多元的客户群体，从政府机关、企业集团和学校宾馆，直到普通个人都是其客户；而且物流快递企业客户的需求具有多样性，表现出来特征是不平衡性及随机性，从个人到团体，从农村到城市，从家庭到企业对物流快递服务有着多层次的个性需求。

4 数据挖掘技术

客户关系管理的数据挖掘技术是指从大量的有关客户的数据中挖掘出隐含的、先前未知的、对企业决策有潜在价值的数据的方法。常用的数据挖掘方法有关联分析、序列模式分析、分类分析、聚类分析、孤立点分析等多种方法。聚类分析可以从给定的数据集中获取数据对象之间所存在的有价值关联要素。在商业上通过聚类将顾客信息分组，描述顾客的购买模式，找出顾客的典型特征，制定个性化营销方案。

5 K-means聚类分析算法在快递CRM中进行客户细分的应用

5.1 K-means聚类算法

K-means作为最常用的聚类算法，能有效地处理大规模和高维的数据集合，把大型数据集进行高效据分组，并根据一定的测量标准，从中找出不同组数据的相似性，进行聚类。

K-means算法的最大优点效率较高，对例外数据非常敏感；缺点是不能处理分类数据，只能处理数值型数据，不能处理非凸面形状的聚类。

K-means算法接受输入量k后将n个数据对象划分为k个聚类，根据点到质心的距离把相似度较高的对象归入同一聚类中，相似度较小的对象归为不同聚类中。然后利用各聚类中对象的均值所获得一个聚类中心来计算聚类相似度。

5.2 K-means算法的处理流程

首先，从c个数据对象任意选择k个对象组成初始聚类中心。

其次，计算每个聚类对象的均值与每个对象的距离；并根据最小距离重新划分相应对象。

最后，重新计算有变化的每个聚类的均值。

循环以上两步，直到每个聚类不再发生变化。

5.3 K-means 算法的改进

K-means算法只能处理数值型数据，而不能处理分类属性型数据。例如表示客户的属性有：名称、性质、住址等属性。K-means算法改进后就能很好地处理分类属性型数据。K-means算法中的距离用相异度来替代，相异度的大小表示距离大小。一个样本和一个聚类中心的相异度用它们各个属性不相同的个数来表示，并用不相同个数的总和来表示某个样本到某个聚类中心的相异度。

5.4 算法的C#实现

public class Kmeans

{ double[]inPut；//数据

int k；//类别数

int Num；//文件数

int sub；//特征值数

int[]groupNum ；//各组数目

public Kmeans（double[，]input）

{ inPut=input；

Num=input.GetLength（0）；

sub=input.GetLength（1）；

k=（int）Math.Sqrt（Num）+1；

groupNum=new int[k]； }

public int[，]GetProcess（）

{ double[，]tmpCenter=new double[k，sub]；

for（int i=0； i < k； i++）

for（int j=0； j < sub； j++）

tmpCenter[i，j]=inPut[i，j]；

double[，]preCenter=new double[k，sub]；

int[，]resultP ；//=new int[k，Num]；

while（true）

{ resultP=new int[k，Num]；

#region //清空各组的数目

for（int i=0； i < k； i++）

{ groupNum[i]=0； } #endregion

#region //根据点到质心的距离，将点放到不同的组中

for（int i=0； i < Num； i++）

{ double tmpDis=0.0；

int index=0；

for（int j=0； j < k； j++）

{ double tmpIn=0.0；

for（int m=0； m < sub； m++）

{ tmpIn+=Math.Pow（（inPut[i，m]-tmpCenter[j，m]），2）； }

if（j == 0）

{ tmpDis=tmpIn；

index=0； }

else

{ if（tmpDis > tmpIn）

{ tmpDis=tmpIn；

index=j； } } }

int groupKnum=groupNum[index]；

resultP[index，groupKnum]=i+1；

groupNum[index]++； } #endregion

#region //保存质心

for（int i=0； i < k； i++）

for（int j=0； j < sub； j++）

preCenter[i，j]=tmpCenter[i，j]； #endregion

#region //确定新质心

for（int i=0； i < k； i++）

{ int kNum=groupNum[i]；

if（kNum > 0）

{ for（int j=0； j < sub； j++）

{ double tmp=0.0；

for（int m=0； m < kNum； m++）

{ int groupIndex=resultP[i，m]-1；

tmp+=inPut[groupIndex，j]； }

tmpCenter[i，j]=tmp / kNum； } } } #endregion

#region //判断质心是否变化

bool judge=true； for（int i=0； i < k； i++）

{ for（int j=0； j < sub； j++）

{ judge=judge &&（preCenter[i，j]==tmpCenter[i，j]）； } }

if（judge） { break； } #endregion }

return resultP； } }

6 测试数据及运行结果分析

某物流快递公司的客户信息数据库的采集数据量为126500。实验的硬件环境：PC计算机，CPU为i5-2410M 2.30GHz，内存为4G；软件环境：操作系统为Windows 7，编程环境 2.0 c#。

运行结果：

K-means算法改进后的运行结果

K-means算法改进后对客户的现有价值和潜在价值进行聚类分析，根据对客户进行分类制定相应的营销政策。实验结果表明，K-means算法改进后对客户分类进行高效处理，解决物流快递企业客户分类的难题。

我们通过数据分析最终把客户分为8类，分别为：企业集团客户、普通企业客户、电商企业客户、家庭客户、普通物流客户、流动型物流客户、稳定型物流客户、潜在物流客户。分类的同时，我们可以得到客户的分组，以及每组的客户选择对用的产品价格和服务，从而为物流快递企业定制个性化服务、实现客户价值、设定合适价格和实行深度营销。

当然研究也有以下局限性：

①样本量太小。由于数据来源问题，样本量的选取不足，没有很多供研究的样本，进而具备更大的研究推广价值。

②研究连续多期的数据，预测客户未来的需求，也是客户流失管理所关心的内容之一。

③综合分析客户的背景资料结合现实进行分析会对企业的客户管理指导意义更大。

综上所述，K-means算法改进后相对有效应用于物流客户聚类分组，能有效地指导各类行业中关于客户数据的聚类分组，建议在今后的研究中能够通过对更加完备的数据的分析来进一步完善该研究方法。

参考文献：

[1]A.Feelders，H.Daniels，M.Holsheimer.Methodological and Practicalaspects of Data Mining[J].Information & Management，2000：271-281.

[2]Kumar P，Krishna PR，Bapi RS，De SK.Rough Clustering of Sequential Data[J].Data & Knowledge Engineering，2007，3（2）：183-199.

[3]Hand D，Mannila H，Smyth P.数据挖掘原理[M].张银奎，廖丽，宋俊，等译.北京：机械工业出版社，2003.

[4]Michael J，Berry A，Gordon S.Linoff.数据挖掘――客户关系治理的科学与艺术[M].袁卫，译.北京：中国财政经济出版社，2004.

[5]卢海燕.将数据挖掘技术应用在客户关系管理中[J].商场现代化，2008（11）.

[6]左国才，杨金民.K-means算法在电信CRM客户分类中的应用[J].计算机系统应用，2010（2）.

[7]王昆.一种基于Bayesian CBR的推荐系统研究[D].石家庄：河北师范大学，2011.

[8]叶勇.基于危险理论的WSN入侵检测技术的研究[D].衡阳：南华大学，2012.

[9]陈亮.图书智能检索系统中的数据挖掘技术研究与应用[D].哈尔滨：哈尔滨工程大学，2012.

K―means 算法在物流快递企业客户细分中的应用

优秀范文