首页 > 范文大全 > 正文

基于本体匹配的数字卡通项目异构知识集成方法研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于本体匹配的数字卡通项目异构知识集成方法研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:在数字卡通项目开发过程中知识的管理和共享面临诸多难题。该文将本体匹配技术应用到数字卡通项目异构知识管理中,给出了一种可行的数字卡通项目知识共享解决方案,并且在该解决方案的框架内探讨了适用于数字卡通项目的本体匹配技术。

关键词:数字卡通;本体匹配;知识管理;项目管理

中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)15-3727-02

An Ontology Matching Method for Heterogeneous Knowledge Integration in Animated Cartoon Project

ZHANG An-qi1,2, LIAO Liang-cai1, SONG Yang3

(1.College of Information System and Management, National University of Defense Technology, Changsha 410073, China; 2.Hunan Animated Cartoon Engineering and Technology Center, Changsha 410073, China; 3.Changsha Department, Hunan Mobile, Changsha 410073, China)

Abstract: Nowadays, there are many intractable problems in knowledge management and sharing under the ground of animated cartoon project management. In this paper, we applied ontology matching technique into the knowledge management of animated cartoon project management, and provide a solution for sharing common knowledge in developing animated cartoon project. Finally, we discuss the ontology matching techniques which are suitable for animated cartoon project knowledge management.

Key words: animated cartoon; ontology matching; knowledge management; project management

1 绪论

目前,数字卡通技术在我国得到了蓬勃发展。作为一种知识密集型的产业,数字卡通的制作与开发过程中涉及到大量的结构化和非结构化的知识,这些知识的分类和抽象、建模与形式化、集成与共享以及管理和重用等都是当前需要深入研究的问题[1]。

然而,由于当前我国数字卡通制作企业在技术储备和规模上仍然处于较低水平,大型数字卡通项目的开发通常需要多个企业协作完成。为了更好地实现资源共享和软实力整合,需要加强对项目相关知识的管理和共享[2]。本文将本体匹配技术应用到数字卡通项目异构知识集成中,探讨了如何通过本体匹配方式构造异构本体之间的结盟和映射,进而实现异构知识的共享和集成。

2 本体异构性与本体匹配

本体是一种将领域知识概念化和模型化的方法,已经被广泛用于描述计算机能够处理的据的语义信息[3]。然而,不同组织开发的本体所描述的领域可能相关,也可能重叠;对相关联领域的描述可能采用不同的语言和组织方式;而且对领域知识描述在侧重点和详细程度上也不可能完全相同[4]。因此,尽管使用本体的初衷是为了能够对领域知识的描述达成共识,但是事实上实际应用却中出现了大量异构本体,而且还将异质问题的提高到了更高的层次。本体的异质性主要体现在如下几个方面[5]:

① 由于使用不同的语言进行领域描述而造成的本体语法异质问题。

② 由于同一实体在不同本体中命名的不同而造成的术语异质问题。

③ 由于对同一兴趣领域建模的差别而造成的语义异质问题。

④ 由于对同一领域的描述在详细程度上的不同而造成的粒度异质问题。

⑤ 由于在不同的上下文环境中对同一实体的解释不同而造成的异质问题。

为了解决上述异构问题,通常通过本体匹配技术建立本体之间的语义映射。

定义1:本体可以定义为,其中:

C为本体类集合;P为本体属性集合,区分为数据类型属性和对象属性;Ins为本体的实例集合; Rp?哿P是一系列关系属性,包括对称属性、传递属性、函数属性和反函数属性等;Hc?哿C×C为概念继承层次结构;Hp?哿P×P为无环的属性继承层次结构;函数给定了属性的定义域;函数:给定了属性的值域。其中对象属性的值域是概念集合,而数据类型属性的值域为数值类型集合DR;函数card:C×PN描述了每个概念-属性对的基数约束。

定义2:对应(Correspondence)是异构本体中实体之间的一种语义关系,通常通过特定的匹配算法来建立。

定义3:映射(Mapping):本体间的语义映射是一个三元组m=<OS,OT,r>,其中OS为源本体,OT为目标本体,r为这两种符号之间的语义关系,一般是指等价或者包含关系。

本体之间的映射根据具体应用的不同其表达形式也有所不同,在本文中使用的语义映射是一种轻量级的本体映射,主要用途是建立本体元素之间的语义关联,为上层的推理服务提供支撑。

3 基于本体的异构知识管理框架

数字卡通开发领域涉及到的知识面非常广泛,包括来自政策法规、共性支撑技术、软硬件设备、企业生产经营等多个方面,仅仅依靠单个本体很难对所有的知识统一建模。而且大一统的本体建模方式不仅费时费力,而且本体的可用性和灵活性都比较差。为了将分散在项目流程各个角落的知识相互关联起来,通常采用本体网络来实现分布、异构知识的建模。

项目知识共享是数字卡通项目知识管理的过程中扮演重要角色。在此可以给出图1所示的知识共享与管理示意图。通过异构本体的匹配和集成,将各种异构知识拼接和整合成一个本体网络,网络中的每个节点就是一个面向具体应用或者某一领域的本体,而网络的边就是本体间的映射,知识的传递、分发和管理都通过该核心的本体网络来完成。本文假设相关的本体均已经构建完成,关键是探讨如何构建各种异构本体之间的语义映射,即找到适用于数字卡通项目知识管理的本体匹配方法。

4 适用于数字卡通项目知识管理的本体匹配方法

本体匹配的目标就是找到异构本体中实体之间的联系,如本体间的因果关系,包含关系和不相交关系等等。本体中的实体可能是复杂的表达式,如公式、概念定义、查询和术语表达式等,通过匹配本体能够使本体中所表现的知识和数据相互协作。在数字卡通项目协作开发过程中开发的本体,通常并不能进行完全匹配,因此通过下述步骤实现本体匹配:

1)名称匹配过程。通过通用匹配过程实现本体元素在名称上的匹配。通常将实体名转化为矢量来处理,使用欧氏距离和余弦相似度(公式1)等来测度实体之间的相似程度。

(1)

2)结构匹配过程。对本体的结构方面的信息,通常是对本体的局部结构和全局结构分别进行进一步匹配。Similarity flooding 是一种面向结构的通用匹配算法,该算法的基本思想是节点间的相似度依赖于它们的相邻节点的相似度。算法基本步骤为:

a将本体转换为一个有向图,其中节点为两个本体的概念对,如果两个节点的概念对之间存在一定的关系则两个节点之间存在一条边;

b为边分配权重,一般来说如果源节点的出度为n,则边的权重为1/n;

c为每个节点赋予初始相似度σ0,可以使用基本匹配方法来给出初始相似度;

d根据选择的公式计算每一节点的σi+1相似度;

e将每个节点的σi+1相似度除以最大值以进行标准化;

f如果相似度的变化不超过阈值ε,即|σi+1(e,e’)- σi (e,e’)|< ε。

3)实例匹配。关注本体实例层面,通常分为取值域的匹配和实例数据的匹配两个方面。本文将实例匹配问题单独划分出来单独匹配,因为实例匹配经常需要人工参与。

4)匹配的补偿。对于未能正确建立匹配的环节加以补偿,这一步的工作是为了使匹配过程更加准确。

基于上述步骤基本上能够解决大多数本体异构的问题,进而为消除数字卡通项目中的知识异构问题奠定基础。

5 结论

在国家科技支持重点项目 “面向全网运营的数字卡通工程化技术研究与应用”(2007BAH14B00)的支持之下,本文探讨了适用于数字卡通项目知识管理背景的本体匹配的方法。后续研究会就这一问题做更为深入的研究,给出相应的原型系统。

参考文献:

[1] 杨鸣唤.中国动漫产业存在的主要问题及对策研究[D].上海:华东师范大学,2007.

[2] 晃翠花,金鑫.基于本体的企业间信息协作的研究[J].东华大学学报:自然科学版,2003,29(6):43-49.

[3] 陆建江,张亚菲,苗壮,等.语义网原理与技术[M].北京:科学出版社,2007.

[4] Berners-lee T,Hendler J,Lassila O.The semantic web[J].Scientific american.2001,284(5):28-37.

[5] Euzenat J.Shvaiko P.Ontology Matching[M].Springer-Verlag,2007.

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文