首页 > 范文大全 > 正文

基于微软分析服务组件的数据挖掘系统的开发

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于微软分析服务组件的数据挖掘系统的开发范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:本文针对国内中小企业商业数据挖掘工具缺乏的状况,自主设计并开发了一个便捷、实用的数据挖掘系统。本系统是在微软分析服务系统及其分析服务组件的基础上,通过整合微软的经典数据挖掘算法开发而成的,力求为中小企业带来全新、便捷、实用的使用体验。

关键词:数据挖掘;微软算法;AMO;

中图分类号:TP18 文献标识码:A 文章编号:1007-9599 (2012) 20-0000-02

1 引言

数据挖掘技术是一项以数据库技术、统计分析、人工智能等为依托的综合性运用技术,它在零售、保险、电信、电力等行业的运用已经显示出巨大的商业价值,并逐步向其他行业渗透。数据挖掘技术能从大量数据中发现并提取隐藏在其中的有用信息,帮助决策者做出正确决策。随着信息化进程的不断推进,企业信息化工作发展迅速,各种辅助管理软件(如ERP、CRM、SCM、PDM等)在企业中都得到了广泛的应用,这些软件的使用为企业积累了大量的数据。中小企业因为其资金实力等限制,更加希望有一些轻量型、廉价、实用的数据挖掘软件,用于企业分析决策。如何从这些大量数据中提取出隐藏的信息,帮助决策者进行决策,将是企业面临的急切问题。

2 分析服务组件介绍――AMO和

微软SQL Server 2005及以上版本都含有分析服务系统(数据挖掘功能模块),该系统是中小企业对数据分析挖掘的首选。而如何利用带有分析服务功能的SQL Server,开发出具有自身特色的数据挖掘应用软件是我们大学生自创小组的目标与任务。我们自创小组开发出的数据挖掘应用软件,计划利用AMO、分析服务组件等来实现。

2.1 AMO体系结构

AMO是一个完整的类库,用于通过客户端应用程序以.NET Framework 2.0 托管代码的方式来管理 Analysis Services 实例。使用 AMO 可以创建、修改和删除对象,如多维数据集、维度、挖掘结构以及 Analysis Services 数据库;可通过 .NET Framework 中的应用程序对所有的对象执行管理操作。用AMO进行编程时,使用类和包含类之间的关联使用集合类型属性,例如 Server 和 Dimension等。

按照设计要求,AMO 只用于对象管理,而不用于查询数据。如果用户需要从客户端应用程序查询 Analysis Services 数据,则客户端应用程序可使用 组件。

2.2 体系结构

是用于与Microsoft SQL Server Analysis Services 进行通信的 Microsoft .NET Framework 数据访问接口。可通过多维表达式(MDX)、数据挖掘扩展插件(DMX)、Analysis Services 脚本语言(ASSL)或者甚至是有限SQL语法来发送命令。可以使用对象模型来查询和操作分析数据、关键绩效指标 (KPI) 和挖掘模型等。

(1)客户端功能模型

与其他 Microsoft .NET Framework 数据访问接口一样,也用作应用程序与数据源之间的桥梁。但 与其他 .NET Framework 数据访问接口的不同之处在于 处理的是分析数据。为了处理分析数据, 支持的功能与其他 .NET Framework 数据访问接口所支持的功能差异很大。 不仅可检索数据,还可检索元数据并更改分析数据存储区的结构等。

(2)服务器功能模型

使用 服务器对象可以为 Microsoft SQL Server Analysis Services 创建用户定义函数 (UDF) 或存储过程。这些进程内方法是通过使用多维表达式 (MDX)、数据挖掘扩展插件 (DMX) 或 SQL 之类的语言创建的查询语句调用的。这些进程内方法还可提供附加功能而不会有网络通信的延迟。

3 本软件系统的设计思想

我们大学生自创小组使用AMO为特定用户组开发管理界面这项功能,在其应用程序中嵌入 Analysis Services 逻辑,并基于用户输入和其他因素创建了多维数据集、维度、挖掘结构和挖掘模型。使用 提供了一个用于查看分析数据源中包含的多维数据集和从属对象的对象模型,通过 AdomdConnection 对象访问有关针对分析数据源定义的联机分析处理 (OLAP) 多维数据集和挖掘模型以及相关对象(如维度、命名集和挖掘算法)的信息。运用Microsoft C#语言,采取结构化查询语句,并结合微软的十大经典数据挖掘算法,设计实现了数据挖掘应用软件系统。

系统实现基于如下组件层次关系图:

图1 组件层次关系图

4 本软件系统的功能及效果简单说明

本软件系统运用库的操作来实现分析挖掘等功能,访问基于组件对象模型的服务端应用程序的多维数据,并且具有自主设计、界面清新、功能便捷操作等特点。在我们的软件系统里,新建数据源、数据源视图、维度等全部包含在Choose Ways这一功能选项中,用户可以根据自己的需求选择不同的挖掘算法,设置数据挖掘结构,在 Conclusion窗口中,系统自动获取数据分析服务端处理后的挖掘结果。这样方便了不懂数据挖掘知识的一般用户,给用户带来操作简单、使用便捷的全新用户体验。

本软件非常适用于中小企业或公司对大量数据的处理,不仅可以显示数据库中的表格数据以便审查,并进行增加、删除、更改等管理操作,还可以根据使用者的具体需求,选定相应的数据属性,达到利用不同的数据属性展现不同的挖掘结果等功能;不仅可以实现多种形式的数据挖掘功能,还可以根据用户需要增加一些新的算法和数据挖掘方式。

本软件的特色是适用于带有SQL Sever分析服务功能的PC机局域网或广域网环境,系统包含微软的十大经典数据挖掘方法,可以很好地处理用户的一般数据分析、挖掘功能。另外,考虑到本软件系统应具有更高的可拓展性和系统兼容性,我们将在未来的软件开发过程中对系统进行部分功能的改进。主要包括:可以把其他数据源的数据导入到当前SQL Sever数据库中,从而更加灵活、便捷的满足用户需求;用户可以在应用程序里选择多个不同的数据表,进行多表数据的挖掘;我们还会根据用户的特殊需求开发相应的挖掘算法来应对用户更多的数据挖掘功能的需求。

5 结束语

我们自创小组根据微软的分析服务组件AMO体系结构和客户端对象和服务器对象等模型的接口,运用库,访问基于组件对象模型的服务端应用程序的多维数据,基于C#语言调用微软的经典数据挖掘算法,开发出了一个具有小型化、操作便捷、适合中小企业使用的数据分析挖掘软件。本数据分析挖掘应用软件的实现,能解决当前中小企业数据泛滥,急需廉价而实用数据分析挖掘软件的问题。

采用类似自主设计开发的思想,未来还可以开发基于Java技术与开源Weka数据挖掘平台的数据挖掘软件系统;基于Oracle数据库挖掘技术的数据挖掘软件系统等的自主创新系统,来适应国内中小企业商务智能应用的需求。

参考文献

[1]龚赤兵.MVC架构与实战[M].北京:电子工业出版社,2009.

[2]邵峰晶.数据挖掘原理与算法.北京:中国水利水电出版社,2005,01,01.

[3]房大伟,吕双,刘云峰. 编程宝典(C#)[M].北京:人民邮电出版社,2011.