首页 > 范文大全 > 正文

多粒度粗糙集模型中属性子集序列的构造方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇多粒度粗糙集模型中属性子集序列的构造方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:针对多粒粗糙集模型属性子集序列构造问题, 提出一种基于属性间距离的构造方法。该方法首先引入信息系统中属性间距离的概念, 并给出距离的定量计算公式;然后根据公式来计算出各个属性之间的距离;最后根据属性之间距离的远近, 得到每个属性的邻域属性集, 从而构造出一个属性子集序列。实验结果表明, 与随机构造的属性子集序列相比, 该方法构造的序列对于实验的每个对象类具有更高的近似精度。因此, 采用所提方法构造出的属性子集序列, 其对应的多粒度粗糙集模型具有更好的近似效果。

关键词:多粒度;属性子集序列;距离函数;近似精度

中图分类号:TP18

文献标志码:A

文章编号:1001-9081(2016)11-2950-04

0 引言

粗糙集理论[1]是由波兰学者Pawlak于1982年提出的一种能够有效处理不精确和不确定信息的数学工具, 目前, 由于它在神经网络、数据挖掘、 决策分析、 机器学习和知识发现等领域[2-6]有着广泛的运用, 使得研究逐渐趋热。粗糙集理论是建立在分类机制的基础上, 通过等价关系将知识空间进行划分。其主要思想是保持分类能力不变的前提下,通过上、下近似去刻画知识不确定性程度,并且通过知识约简、规则提取去挖掘数据中潜在的信息, 粗糙集理论最大的特点就是不需要数据集之外的任何先验信息, 因此对于不确定信息进行分析处理还是比较客观的。近年来, 为了从多粒度、多层次的角度去处理和分析问题, Qian等[7-9]提出了多粒度粗糙集模型, 其主要思想是将属性集构建成一组属性子集序列, 通过这一系列属性子集来对论域进行划分, 构成了多粒度的论域空间, 然后在多粒度论域空间中对目标概念进行近似逼近。随后, 一些学者在Qian等基础上对多粒度粗糙集做了许多扩展和改进[10-13]。但是在多粒度粗糙集模型的研究中, 对于如何构建一个较好的属性子集序列, 目前并没有给出一个很好的方法。

本文针对多粒度粗糙集模型中关于属性子集序列的构建问题, 提出一种较好的构建方法, 其主要思想是引入统计学中关于变量间的相似系数来刻画属性间的距离[14-15], 通过属性间距离的远近来对属性进行区分归类, 进而构建一组属性子集序列。由于目前的多粒度粗糙集模型中分为基于等价关系的多粒度粗糙集模型和邻域多粒度粗糙集模型[12], 因此本文分别定义了符号型属性间的距离和数值型属性间的距离。最后通过实验分析, 验证了本文构建的属性子集序列具有更好的近似效果。

从定义8可以看出, 本文构造的多粒度属性子集序列是将属性之间距离较小的属性归类成一组, 由于数据集之间的差异, 这里无法给出具体的邻域半径取值, 但是通常可以取[0,0.5]。由于属性间的距离是根据统计学中变量之间相似系数[14]得来, 因此通过这种方法构造出的多粒度属性子集序列, 其每个属性子集内的属性之间依赖程度较高, 这样更具一定的合理性。最终构建的属性子集序列形成的是属性全集上的一个覆盖。为了验证本文构造的属性子集序列更为优越, 下面将通过实验来具体分析。

3 实验分析

为了验证本文方法性能,这里从UCI Machine Learning Repository获取了4个数据集进行实验分析和评估。具体信息描述如表2所示。

在表2中, 编号为1、3和4的数据集属性均为数值型属性, 编号为2的数据集属性为符号型属性。根据定义7中属性间距离的定义方式, 这里可以得出4个数据集属性间的距离矩阵, 其分别表示为:

对于数据集中的每个类, 分别计算出它们在构造的属性子集序列下多粒度粗糙集模型中的近似精度。为了作对比, 本实验另外随机构造了3个属性子集序列作为参照, 并且计算出每个类在各个参照序列下的近似精度。最终每个数据集的实验结果如图1所示。

由于数据集1、3和4属性均为数值型, 因此计算的为每个类在邻域多粒度粗糙集模型下的近似精度。

通过实验结果可以看出, 对于数据集中每个类, 本文方法构造出的属性子集序列(即实验序列)相对于随机生成的参照序列, 其近似精度均更高一点,因此, 本文方法构造出的属性子集序列在其多粒度粗糙集模型的近似方面具有一定的优越性。

4 结语

针对目前多粒度粗糙集模型中属性子集序列的构造问题, 本文通过引入属性间距离函数的方法, 定量地刻画了属性之间距离的远近, 并将距离较近的属性归为一类, 从而构造出一组多粒度属性子集序列。通过实例分析可以看出, 本文中构造出的属性子集序列在其近似对象的近似计算方面具有更高的精度。由于本文未给出属性邻域半径λ的选取方法, 因此在接下来的工作中需要探索如何去选取合适的属性邻域半径。

参考文献:

[1] PAWLAK Z. Rough sets[J]. International Journal of Computer & Information Sciences, 1982, 11(5): 341-356.

[2] WANG D L, SONG X F, YUAN J Y. Forecasting core business transformation risk using the optimal rough set and the neural network[J]. Journal of Forecasting, 2015, 34(6): 478-491.

[3] CHEN L F, TSAI C T. Data mining framework based on rough set theory to improve location selection decisions: a case study of a restaurant chain[J].Tourism Management, 2016, 53:197-206.

[4] ZHANG H D, SHU L, LIAO S L. Generalized intuitionistic fuzzy soft rough set and its application in decision making[J].Journal of Computational Analysis & Applications, 2016, 20(4):750-766.

[5] SARAH V, LYNN D, YVAN S,et al. Applications of fuzzy rough set theory in machine learning: a survey[J].Fundamenta Informaticae, 2015, 142(1/2/3/4):53-86.

[6] RAHMAN A, MUHAMMAH H, SUNGYOUNG L, et al. Rough setbased approaches for discretization: a compact reviews[J].Artificial Intelligence Review,2015,44(2):235-263.

[7] QIAN Y H, LIANG J Y, YAO Y Y, et al. MGRS: a multigranulation rough set[J]. Information Sciences, 2010,180(6): 949-970.

[8] QIAN Y H, LIANG J Y, DANG C Y. Incomplete multigranulation rough set[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part A: Systems and Humans,2010, 40(2): 420-431.

[9] QIAN Y H, ZHANG H, SANG Y, et al. Multigranulation decisiontheoretic rough sets[J]. International Journal of Approximate Reasoning, 2014, 55(1): 225-237.

[10] 张明, 程科, 杨习贝,等.基于加权粒度的多粒度粗糙集[J].控制与决策, 2015, 30(2):222-228.(ZHANG M, CHENG K,YANG X B, et al. Multigranulation rough set based on weighted granulations[J]. Control and Decision, 2015, 30(2):222-228.)

[11] YAO Y Y, SHE Y H. Rough set models in multigranulation spaces[J].Information Sciences, 2016, 327(C):40-56.

[12] LIN G P, QIAN Y H, LI J J. NMGRS: neighborhoodbased multigranulation rough sets[J]. International Journal of Approximate Reasoning, 2012, 53(1): 1080-1093.

[13] SUN B Z, MA W M. Multigranulation rough set theory over two universes[J].Journal of Intelligent & Fuzzy Systems, 2015, 28(3):1251-1269.

[14] 高惠璇.应用多元统计分析[M].北京:北京大学出版社, 2005:218-228.(GAO H X. Applied Multivariate Statistical Analysis[M].Beijing: Beijing University Press, 2005:218-228.)

[15] 贾俊平, 何晓群, 金勇进.统计学[M].北京:中国人民大学出版社, 2012:226-230.(JIA J P,HE X Q,JIN Y J. Statistics[M]. Beijing: China Renmin University Press, 2012:226-230.)

[16] HU Q H, YU D, LIU J F, et al. Neighborhood rough set based heterogeneous feature subset selection[J].Information Sciences, 2008, 178(18): 3577-3594.

[17] HU Q H, YU D, XIE Z X. Neighborhood classifiers[J].Expert Systems with Applications, 2008, 34(2): 866-876.

[18] LIN T Y, LIU Q, HUANG K J, et al. Rough sets, neighborhood systems and approximation[C]// Proceedings of the 5th International Symposium on Methodologies for Intelligent Systems. London: SpringerVerlag, 1990: 130-141.