首页 > 范文大全 > 正文

基于不完备信息系统的观众兴趣特征提取算法研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于不完备信息系统的观众兴趣特征提取算法研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】目前人工智能在智慧博物馆建设领域中发展迅速,准确采集观众兴趣是为博物馆提供更好展示服务的前提,但智能化计算算法无法完全满足浮动巨大的观众兴趣数据分析。针对此问题,从一种粗糙集中导出不完备信息系统的模糊度,并讨论了其概念与性质,通过例子指出了其在智慧博物馆观众兴趣采集方面的应用价值。

【关键词】粗糙集;不完备信息系统;兴趣特征;提取算法;隶属函数

1.引言

目前,智慧场馆是博物馆建设的主要方向,人工智能在智慧化场馆建设领域中占重要地位,其在大量非线性观众数据分析方面的作用尤为明显。在智慧场馆建设中,提取观众参观过程中的兴趣数据可以为场馆建设展示提供良好的数据基础,而观众兴趣数据的分析属于对不完备的信息的判断和总结。目前大部分智能算法在观众兴趣特征的提取上并不理想,所以,推导了一种由粗糙集导出不完备信息系统的模糊度来进行观众兴趣特征的提取,通过计算模糊度函数合理有效的将观众兴趣特征提取出来,以达到收集观众兴趣点的目的。

2.基本概念

设U=(X,ST)是一个信息系统,其中X为非空有限论域,X中的元素称为对象,ST是有限非空属性集,对于每一个s∈S,s:XVS(VS不同于后文的Vs)且x∈X,s(x)∈V∞称VS为属性s的值域。如果信息系统中的某些属性值缺省或部分知道,这样的系统称为不完备信息系统,属性值函数s(x)可以定义为从X到VS的幂集的一个集值映射。

一个不完备决策表U=(X,ST∪{d}),其中X={x1,x2,x3,……},ST={s1,s2……}代表病害特征的条件特征属性,d代表病害特征的决策特征属性,Vs={Vs1,Vs2,……}代表特征的指标。

算法表示中以∧表示逻辑“与”。若v∈Vs∈S,属性对(s,v)称为是S的基本元。所有的S的基本元或者它的逻辑“与”∧连接成为S描述,设t为描述,若基本元(s,v)存在于t中,称(s,v)∈t,若s∈S,(s,v)∈t,则称t为S的全描述。t={x∈X:v∈s(x);(s,v)∈t}称为t的支持集。如果t和a是两个描述且S(t)∩S(a)是空集,可以得到t∧a =t∩a。

如果记DES(S)={t:t是S的描述;}。

对于任意的t∈DES(S),如果S(t)=S,则t是完全的S的描述,记FDES(S)={t:t是S的完全描述}。设U={X,ST}是一个不完备信息系统,对于任意的s∈ST和v=Vs如果v∈s(x)∩s(y),即,x和y被称为关于属性s类似,同样,若,t∈FDES(S),x,y∈X,则x,y被称为关于S类似当且仅当,这些类似关系就把有限论域X分成了作为基本模块(称为描述集)的几个基本模块,这些描述集类构成了X的一个覆盖,记为X/S={t:t∈FDES(S)},包含x的描述集类记为S(x),即S(x)={t:t∈FDES(S)}

3.粗糙集的构造

定义,设和,XI关于S下近似和上近似分别记为和,其中:

-称为XI关于S的边界(代表空集),记为。注:这里所定义的下近似和上近似集合,其中的元素师描述集类,而不是X的一个子集。

把与集合X中元素x具有相同描述的元素构成的集合称为相似集,记为,则:

4.模糊函数及其性质

模糊函数定义为:

称为关于属性集S属于集合Y的隶属度,直观意义为u属于集合Y的模糊度。

性质1:

(1)。

(2)。

反之则不成立。

证明:

(1)如果,根据定义有:,因为,于是。

(2),根据定义有:。因为于是。

性质2:如果,则有。

证明:因为,则有:

则:

因此 。

性质3 :

(1)

(2)如果或者,则:

证明:

(1)可以从性质2导出。

(2)如果,那么,且。

则有:

性质4:设,表示的补集。则。

证明:

所以:,也就是

表1 不完备决策表

X S1 S2 d

x1 N N N

x2 N、H N H

x3 N N、H N

x4 L L L

x5 H N、H H

x6 N、H H H

x7 N、L N L

5.应用

设有关于观众样本和兴趣特征的不完备决策表U,U=(X,ST∪{d}),其中X={x1,x2,x3,……x7}代表不同样本集,ST={s1,s2}代表兴趣的条件特征,d代表该兴趣的决策特征(即判断观众兴趣表现的主要特征判断依据),Vs={Vs1,Vs2}代表特征的指标,如观众兴趣集Vs={L,N,H},L表示停留时间短、兴趣不大,N表示观众正常停留观看,H表示观众长时间停留、对该位置展品表现出极大兴趣。有Vs1={L,N,H}。属性表如表1所示。

则根据表1、概念和粗糙集的构造方式:

x2,x5,x6,的关于属性S1的值都具有“H”,则关于属性S1他们都应属于同一个描述累(a,H),即(a,H)={x2,x5,x6}。用S1,S2,ST={S1,S2}的描述集类可表示一下分类:

X/{S1}={(S1,N),(S1,H), (S1,L)}={{x1,x2,x3,x6,x7},{x2,x5,x6},{x4,x7}}。

X/{S2}={(S2,N),(S2,H), (S2,L)}={{x1,x2,x3,x5,x7},{x3,x5,x6},{x4}}。

X/ST={(S1,N)∧(S2,N),(S1,N)∧(S2,H),(S1,H)∧(S2,N),(S1,H)∧(S2,H),(S1,L)∧(S2,L),(S1,L)∧(S2,N)}={{x1,x2,x3,x7},{x3,x6},{x2,x5},{x5,x6},{x4},{x7}}。

同时也容易看到:{S1}(x2)={{x1,x2,x3,x6,x7},{x2,x5,x6}}。

设XI={x2,x5,x6},

经计算可得:={{x2,x5,x6}},={{x1,x2,x3,x6,x7},{x2,x5,x6}}。

,={{x1,x2,x3,x5,x7},{x3,x5,x6}}。

={{x5,x6}},={{x1,x2,x3,x7},{x3,x6},{x5,x6},{x2,x5}}。

={{x1,x2,x3,x7},{x3,x6}}。

相似集:

{N}={x∈X:

d(x)=N}={x1,x3},{H}={x∈X:

d(x)=H}={x2,x5,x6},{L}={x∈X:

d(x)=L}={x4,x7}。

则{N},{H},{L}构成了X的一个划分,根据模糊度函数计算{N},{H},{L}的模糊度构成粗糙隶属度函数表,如表2所示。

表2 粗糙隶属度函数表

X N H L

x1 1/2 1/4 1/4

x2 2/5 2/5 1/5

x3 2/5 2/5 1/5

x4 0 0 1

x5 0 1 0

x6 1/2 1/2 0

x7 1/2 1/4 1/4

那么就可以从表2中的隶属度值清楚地看出每个样本元素是否正常,其判断标准为每个样本特征指标的函数值。当一个特征的函数值表现的很大时,就可以确定该样本的观众存在相应较大的兴趣,达到观众游览兴趣特征提取的目的。

6.结论

上述内容定义了不完备信息系统的描述集类,上下近似,构造了相应粗糙集。在不完备决策表中构造了模糊函数,以求得每个元素的隶属度得出结论,为实际问题的判断提供了依据。

参考文献

[1]向东,赵勇,陈阳.面向语义信息的案例知识表达与相似度计算方法研究[J].计算机工程与科学,2011(12).

[2]周文,刘焕,王翼飞.改进的概率权重随机模拟算法[J].应用科学学报,2008(07):26-4.