首页 > 范文大全 > 正文

基于频繁子树挖掘的供应链优化方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于频繁子树挖掘的供应链优化方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:对绝大多数厂商来说,其成败的关键在于其产品是否能通过自身的营销渠道和供应链系统得到有效和快速的销售。因此,营销渠道的供应链管理对市场竞争来说至关重要。由于企业的供应链系统可以近似地用树结构来表示,本文提出了一种新的基于频繁子树挖掘供应链管理优化策略,并以鄂尔多斯集团的真实销售与物流数据为例,说明了本文提出的方法

关键词:供应链管理;频繁子树;TreeMi ner算法

中图分类号:C94 文献标识码:A 文章编号:1005-6432(2008)36-0092-03

Optimized of Supply Chain Management Based on Frequent Subtree Mining

Gao Peng1,2 Bao Xinzhong1 Wang Daoping1

(1.School of Economics and Management, University of Science and Technology Beijing; 2.Inner MongoliaErdos Group Co. Ltd)

Abstract: For most manufacturers, success or failure is determined by how effectively and efficiently their productsare sold through their marketing channel members and their supply chain, so the management of supply chain plays animportant role in market competition. Recently, with the increase of amount of sales data, how to enhance the supply chainquantitatively is significant. As the supply chain can be viewed as a tree, in this paper, an optimized method supply chainmanagement based on frequent subtree mining is proposed. The proposed method is illustrated under the real-world salesdata in ERDOS group.

Key Words: supply chain management; frequent subtree; the treeminer algorithm

一、引言

供应链的概念是20世纪80年代初提出的,但其真正发展却是在90年代后期。供应链译自于英文的“S u p p l yC h a i n”,供应链管理则译自英文的“S u p p l y C h a i nManagement(SCM)”。随着时代的发展,企业之间的竞争也正日趋演变为供应链与供应链之间的角逐。如何根据企业自身运营特点和自身条件有效整合物流与供应链管理,已经是中国企业面临的战略课题。供应链管理是把整条供应链上的活动作为一个连续的、无缝的过程来加以规划和优化,要求企业根据变革的需要进行必要的业务重组和流程再造,依照“用户需求”和“流程管理”的思想对企业进行优化重组,据此提升整条供应链乃至整个企业的竞争力。企业的供应链系统可以视为一个网络系统。在这个系统中,存在一系列为了拥有共同的“产品”而相互联系和相互影响的子系统(即厂商、批发商、零售商、消费者 等)。

近年来,由于绝大多数商品使用了条形码技术,形成了各种类型的海量数据库。这些数据不仅反映了企业当时的运营情况,同时这些海量原始数据的真正价值体现在人们能够从中发现和理解控制相应数据源的内在规律。如何更有效地利用这些企业运营的历史数据,更有效地发现数据中蕴涵的规律(知识),揭示事物发展变化的内部规律,发现不同的事物之间的相互作用关系,对于人们正确认识事物和科学决策提供依据等具有重要的意义。知识发现(Knowledge Discovery in Database,KDD)与数据挖掘技术(Dat a Mi n i n g,DM)为这一问题的解决提供了一条切实可行的思路和途径。营销渠道的管理现有的大部分研究工作都采用定性的方式。近来,随着增加的数额销售数据,如何借助数据挖掘手段对企业供应链进行分析研究具有重要意义。由于企业的供应链可以近似地用树结构来表示,本文提出了一种新的基于频繁子树挖掘的供应链管理优化策略,并以鄂尔多斯集团的真实销售与物流数据为例,说明了本文提出的方法。

二、频繁子树挖掘

在过去的10年中,基于事务数据和序列数据的频繁模式挖掘已被广泛研究。而最近的新兴应用,比如生物信息学、数字图书馆、电子商务等提出了在复杂的结构化数据中挖掘频繁模式的要求。挖掘频繁的子结构(树和图)成了又一个重要的研究课题并被应用于更为复杂的领域,比如生物信息学、网络日志和X M L。同时,频繁子树挖掘本身也充满了挑战性。

一个树是由二元组T=(V,E)构成,其中V={0,1,…,n}为结点的集合,E={(x,y)|x,y∈V}为边的集合。对于所有的x∈V,都存在唯一一条从根结点r到x的路径。对x,y∈V,若存在一条从根结点r到y的路径,且x,在y的前面,那么x是y的祖先,y是x的子孙。如果x是y最接近的祖先,则x称为y的父节点,y叫做x的子节点。

给定有序标号树的数据库T D B以及子树T,T的支持度定义为s u p(T)=|p(T)/N|,其中p(T)是T D B中包含T的树的棵数,N是TDB中树的棵数。所以, T是频繁子树当且仅当sup(T)≥min_sup。这里min_sup是用户指定的支持度阈值。

若树T’=(V’,E’)是树T=(V,E)的子树(嵌入式子树或导出式子树),则称树T包含T’。

频繁子树挖掘就是,给定有序标号树的数据库TDB和最小支持度min_sup,找到所有的频繁子树。

三、频繁子树挖掘在供应链管理中的应用

鄂尔多斯羊绒集团是一家著名的羊绒产品加工公司。至目前为止,该公司在国内有32个销售公司,19个业务代表处,31个调度和商品配送中心和大约1000多个销售终端。因此,鄂尔多斯羊绒集团已建立我国服装行业最大的营销/供应链配送网络。近年来,随着营销渠道网络的信息化水平的提高,系统收集了大量的销售数据。如何充分利用现有数据,以提高现有供应链的效率是非常重要的。我们采用频繁子树挖掘来发现一些有益的树模式。

1.供应链系统的数据库表示

一般来说,鄂尔多斯羊绒集团的整个营销及供应链体系可以被看成五个层次的树(见图1)。在图1中,节点A;B1,…,Bm;C1,…,Cn; D1,…,Di;E1,…,Ej;表示不同层次的销售成员。节点在不同层次可能代表不同的渠道成员,如商、批发商、分销商和零售商。

图1 鄂尔多斯供应链系统树状结构图

我们收集到每个节点从20 02年到20 06年的销售数据,数据以月为单位。该数据库包含12×5=60的交易,每一条项目对应图1中的一个节点。值得注意的是,我们并不需要每笔交易,而只考察那些完成了基本销售额的销售成员。举例来说,销售计划规定2006年10月零售商的最低销售额是50000,如果零售商Ej没有完成基本销售额要求,则Ej不会被包含在2006年10月的交易数据库里。

2.挖掘频繁子树

如上节所述,我们建立了包含6 0条树事务的鄂尔多斯羊绒集团营销渠道数据库,每个树事务最多拥有( )个结点。给定最小支持度阈值m i n_s u p,挖掘出所有的频繁标记嵌入子树,需要注意的是,我们之所以挖掘嵌入式子树,而不是挖掘导出式子树,是因为嵌入子树是一个泛化的导出子树,嵌入子树不仅包含父子关系的分枝,而且包含祖孙关系的分枝。因此,嵌入子树能够在一个庞大的树提取传统定义遗漏的“隐性”(或嵌入)的模式。

本文所使用的频繁子树挖掘方法是Z a k i等提出的TreeMiner。TreeMiner算法是一种挖掘频繁嵌入子树的算法,该算法利用深度优先/广度优先结合的方法从有序标号树数据库中挖掘所有的频繁嵌入子树。除了向下封闭性质(所有频繁子树的子树仍然是频繁的)外,Tr e eM i n e r算法还利用了一个有序标号树字符串编码的一个有用的性质:去掉有序标号树P的字符串编码最后两个节点的任何一个就能得到一个p的嵌入子树的字符串编码。此外,在支持度计数方面,Tr e eMi ner使用了一种称做范围列表(Scopelist)的树的表达方法。

3.频繁子树的应用

通过对所构建的营销/供应链数据库的挖掘,得到的频繁子树可以分为两类。

(1)频繁导出式子树可以代表组织良好的供应链配送渠道,见图2(a),具有这种要素的子树模式应该保留或者推广。

(2)挖掘得到的嵌入式子树可以找到潜在的、可替代现有的配送模式。例如,图2(b)显示了一个频繁嵌入式子树。我们可以看到Dm和Dn的父母,以及Bi子女并不包含在频繁模式里,对于这种情况,可以做出如下调整:①降低Bi的层次;②提高Dm和Dn的层次;③直接删除Dm、Dn和Bi之间的层次,使它们直接连接起来。

(a)导出子树 (b)嵌入子树

图2 频繁子树的类型举例

通过对营销/供应链数据库的挖掘,对不同的频繁子树模式进行区分,可以判断营销/供应链的状况,并根据渠道状况进行渠道调整。对于符合导出式子树特征的子树予以保留和推广,对于符合嵌入子树特征的模式的营销渠道进行调整和改善。

四、结论

营销/供应链管理对于大部分企业来说至关重要,近年来,随着销售数据的快速积累,如何提高渠道/供应链效率成为摆在我们面前的一个重要问题。企业的营销/供应链系统可以看成一个类似树的结构,本文将频繁子树挖掘方法应用于营销渠道研究,采用鄂尔多斯羊绒集团公司真实的销售数据建立了销售/供应链数据库,运用Tr e eM i n e r算法,发现了渠道中两类不同形式的频繁子树,并根据不同情况,提出了管理对策。

作者单位:

高 鹏 北京科技大学经济管理学院内蒙古鄂尔多斯集团公司

鲍新中 北京科技大学经济管理学院

王道平 北京科技大学经济管理学院

参考文献:

[1]斯特思,安瑟理,库格伦.赵平译.市场营销渠道[M].北京:清华大学出版社,2001:35-68.

[2]Han J W,Kamb er M.Data Mi n i ng:Conc ept s andTechniques[M].San Francisco,CA:Morgan Kaufmann,2006.

[3]Coughlan A,Anderson E,Stern L W,El Ansary A.MarketingChannels[M].Englewood Cliffs,NJ:Prentice Hall,2005.

[4]Pelton L,Lumpkin J R,Strutton D.Marketing Channels:ARelationship Management Approach[M].McGraw-Hill,2001.

[5]Zaki M J,Aggarwal C.XRULES:An Effective StructuralClassifier for XML Data[A].Proceedings of 9th InternationalConference on Knowledge Discovery and Data Mining[C],2003:316-325.

[6]Zaki M J.Efficiently Mining Frequent Trees in aForest:Algorithms and Applications[J].IEEE Transaction onKnowledge and Data Engineering,2005,17(8):1021-1035.