首页 > 范文大全 > 正文

基于MAS的数据挖掘模型自动选择方法探讨

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于MAS的数据挖掘模型自动选择方法探讨范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘 要】数据挖掘可以将大量的业务数据转换成有利用价值的信息和知识,促进行业的发展,因此,数据挖掘已经引起了信息产业界的极大关注。利用数据挖掘技术为行业的发展解决各种实质性问题的关键是对数据挖掘模型的选择。本文就探讨一下基于mas数据挖掘模型自动选择方法

【关键词】MAS数据挖掘 模型 自动选择方法

数据挖掘可以将大量的业务数据转换成有利用价值的信息和知识,促进行业的发展,因此,数据挖掘已经引起了信息产业界的极大关注。为了解决从大量数据中方便快捷的提取处对人们有用的数据,在许许多多的研究人员的努力下,数据挖掘逐步走向人工智能化,,并且逐步发展趋于成熟。利用数据挖掘技术为行业的发展解决各种实质性问题的关键是对数据挖掘模型的选择。传统的数据挖掘模型的设计对建模人员的专业知识依赖性很大,需要专业人员充分的对应用领域的业务特征进行分析,并对数据进行重复的探索,对算法进行反复的测试,所以,工作效率地,而且模型的准确度也不高。随着科学技术的发展,基于MAS的数据挖掘模型自动选择架构产生了,大大提高了建模效率、解决了知识服用困难等问题。经过人们的努力研究,人们发现,对于不同挖掘对象和应用需求,不同的数据具有着不同的重要性,因而面对各种不同数据对象分析提取需求,人们发展了多种不同的数据自动选择算法,不同的算法指导着不同的自动选择方法,本文就基于MAS的数据挖掘模型的自动选择方法进行探讨

一、基于MAS的数据挖掘模型抽样自动选择方法

抽样自动选择方法是最基本的数据挖掘模型选择方法之一,它从原始数据库中抽取一样本,更加便于对数据的存储,同时可以减少数据挖掘的时间。还可采用哈希技术对抽样候选项目集进行修剪,为了减少数据库扫描次数,采用关联规则挖掘的基本模型对整个数据集采用关联规则进行优化。通过关联规则,可以使得对数据集中的频繁项目原数据集扫描一次就确定更新后的整个数据集中新频繁项目。

二、基于MAS的数据挖掘模型的分类自动选择方法

分类算法属于有指导的数据挖掘方法,而数据挖掘方法同时又依赖取决于不同的算法。算法的目的就是为了建立一个分类函数或者分类模型从而把数据集中的数据项映射到给定的某一类别。从人们对有用数据的分类和提取这一需要发展至今,人们己经提出过很多算法。分类算法本身利用数据集的构造特点,人为地制造一个分类器对数据集中的各个样本数据加以筛选分类。为此,人们经过数代人的努力,人们创建了实用的数据选择方法,基于MAS的数据挖掘模型的主要有决策树数据自动选择法,后向传播数据自动选择法,贝叶斯数据自动选择法,它们分别基于决策树分类法,后向传播分类法和贝叶斯分类法。"

(一)基于MAS的数据挖掘模型的决策树自动选择法

决策树自动选择法,利用决策树分类法,通过对训练样本集,可以把分类模型给出的预测试集数据的类别分类的相当直观更加易于理解,用户在不懂模型原理的情况下也可以进行分类。决策树自动选择法发展至今,已经不再单单是加入信息量度量的ID3算法,它已经扩充到了现在的多种算法。决策树自动选择法对应用于数据挖掘特征选择和挖掘样本的规模有较大关系,据相关文献研究,决策树选择方法实现了旋转机械的轴承缺陷的抽取,该研究通过优化样品选择,提高了决策树自动选择法的准确性。

(二)基于MAS的数据挖掘模型的法后向传播自动选择法

基于MAS的数据挖掘模型的后向传播自动选择法利用后向传播神经网络由于具有良好的非线性映射能力和对任意函数的准确逼近能力,使得其处理分类问题能获得很高精度。神基于MAS的数据挖掘模型的后向传播自动选择法在噪声环境下也能很好的完成分类任务。同时,它无需提供被分析数据之外的任何先验信息。虽然基于MAS的数据挖掘模型的后向传播自动选择法精确度非常高,但是它也存在自身缺点,网络训练时间较长,不适用于处理多维大规模的数据,而且基于MAS的数据挖掘模型的后向传播自动选择法是利用神经网络挖掘的结果,该模式本身不具有可理解性,使得人们对网络的学习和决策过程难以理解,从而,缩短基于MAS的数据挖掘模型的后向传播自动选择法的网络训练时间和使其变得具有可理解性是被人们广泛关注的问题。

(三)基于MAS的数据挖掘模型的贝叶斯自动选择法

基于MAS的数据挖掘模型的贝叶斯自动选择法通过运用贝叶斯分类算法,可以预测一个给定样本属于某一类别的概率,要理解这一自动选择方法,需要人们具有较强的学习和推理能力。基于MAS的数据挖掘模型的贝叶斯自动选择法对于人们来说,经过学习和推理,可以很容易被人们所理解,但是其准确性却有待提高,这是由于贝叶斯定理的自身限制所造成的。贝叶斯定理本身的成立就需要一个很强的独立性假设前提,然而这种假设前提在实际情况中通常并不是成立的,因而,其自身的性质决定着其准确性会下降。使用基于MAS的数据挖掘模型的贝叶斯自动选择法,通常先假设一个属性值对给定类的影响独立于其它属性的值,具有独立条件,它可以对构造贝叶斯分类器时所需要的计算量大大缩减,简化计算。

综上所述,基于MAS的数据挖掘模型自动选择法,目前仍然处在一个逐步完善的阶段,虽然人们对运用它解决问题的需求随着社会的发展越来越大,但是由于基于MAS的数据挖掘模型的自动选择法针对不同的数据对象需要不同的数据算法来做为基础的理论依据,而我现有的分类数据算法理论并不能满足该方面的需求,基于MAS的数据挖掘模型的自动选择法人需要我们这代人甚至多代人的努力才能完全实现智能化,更好的为人们的生活服务。为了能过让人们对数据处理起来更加的方便快捷,同时利用最少的时间获取最有意义和价值的数据信息,历史的重任需要我们这代人加倍努力才行,相信我们新时代的人们一定努力实现它,为我们自己加油!

参考文献:

[1]李春生;檀坤;;基于Multi-Agent的数据挖掘模型及其应用[J];长江大学学报(自然科学版)理工卷;2011年04期

[2]李春生;单继辉;杨冬黎;;基于规则的数据挖掘算法选择机制研究[J];长江大学学报(自然科学版)理工卷;2012年03期

[3]郑庆生;韩大匡;;高阶神经网络在储层分布参数定量预测中的应用[J];地球物理学进展;2012年02期

作者简介:朱岩(1982- ),男(汉族),陕西咸阳,华东师范大学硕士,主要研究方向:软件工程。