首页 > 范文大全 > 正文

领域本体的构建研究――以“数据结构”为例

开篇:润墨网以专业的文秘视角,为您筛选了一篇领域本体的构建研究――以“数据结构”为例范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:网络教育是国内外教育发展的新方向,资源共享是提高网络教育质量、降低教育成本的有效途径。但由于没有统一的教育知识表示方法,学习资源在各学习系统间难以实现共享。该文以“数据结构”为例说明构建领域知识本体的一般步骤,获取课程知识内容,采用标准的OWL本体描述语言对其进行定义和描述并形成领域本体。

关键词:本体;知识表示;领域本体;网络教育

中图分类号:G434文献标识码:A文章编号:1009-3044(2012)04-0967-04

The Study for Engineer Domain Ontology: An Experience in Developing Data Structures Ontology

YANG Jin

(Information College, Yunnan Normal University, Kunming 650500, China)

Abstract: E-learning is a new direction for the development of international education. An effective way to reduce the cost of education, improving the quality of network education is sharing of resources. However, the absence of a unified education knowledge representation make the shared of the learning resources to be difficult among different learning systems. Use the example of "data structures" course to illustrate how to use ontology to describe curriculum knowledge. The general approach is to get terms of course, using the standard OWL ontology description language to define and describe it to form the domain ontology.

Key words: Ontology; knowledge representation; domain ontology; network education

随着互联网技术的发展,运用本体论理论通过互联网技术进行知识和信息资源的整合是必要的。目前的知识己经愈来愈明显地表现出跨越多学科的特点,此种结构特点使得知识表现模型的相关性显得复杂且不单一,运用本体进行课程知识描述,在强调了概念的单一性和无二性的同时,在概念和概念之间、对象与对象之间建立了清晰的相关联系。

在教育领域,国内外关于本体在智能教学系统的研究已有一些进展。利用本体表示的知识不仅有助于知识、信息资源的系统化,而且也便于知识、信息资源的扩展和更新,使之更容易满足不同层次、不同需求的个人终生学习。使用本体来表示知识,构建领域本体,能够促进智能学习系统的有效开发。

1本体的相关概念

1.1本体的定义

本体论(Ontology)来自哲学领域,旨在研究客观事物存在的本质和组成[1]。随着信息科学的飞速发展,本体论逐渐用于知识工程和信息科学等领域之中。

在知识工程领域中,本体通过对于概念及其相互关系的规范化描述,勾画出某一领域的基本知识体系。

在计算机科学领域,斯坦福大学的Gruber认为“本体是概念化的明确的规范说明,能够以一种明确的、形式化的方式来表示领域知识,促进知识共享”。

本体论可以分为四种类型:通用、应用、领域和任务。

1.2本体建模元语

Perez认为Ontology包含五个基本的建模元语(Modeling Primitive):

(1)类(Classes)或概念(Concepts):表示领域知识元,包括一般意义上的概念以及任务、功能、策略、行为、过程等,通常具有一定的分类层次关系。

(2)属性(Properties):描述概念的性质。

(3)关系(Relations):表示概念之间的关联,在形式上定义为n维笛卡儿积的子集:

R:C1×C2×…×Cn。

(4)函数(Functions):表示一类特殊的关系,即由前n-1个要素来唯一决定第n个要素。

(5)实例(Instances):表示属于某个概念类的具体实体。

1.3构建本体的步骤

构建领域本体的目标就是要将一个或多个特定领域的概念和术语规范化,为其在该领域或领域之间的应用提供便利。面向不同的学科领域、不同的应用需求,本体构建的方法不同。比较成熟的本体构建方法有IDEF-5法、Skeletal Methodology骨架法、TOVE企业建模法、METHONTOLOGY方法、Cyclic Acquisition Process循环获取法、软件工程法等。文本以“数据结构为例结合上述本体构建方法来构建领域本体[2,3]。

构建本体的一般步骤:

(1)列出研究对象所涉及到的概念(concepts);

(2)按照概念的固有属性和专属特征进行归纳和修改,对概念建立类(class)以及层级化的分类模型(taxonomy);

(3)加入关系(relation)连接concepts;

(4)按照需要添加实例(instance)作为概念的具象。

2“数据结构”领域本体的构建

通过分析“数据结构”的知识结构,并结合本体的五个基本的建模元语,得到该领域本体五元组表示:

O=

其中,O表示领域本体,C表示本体的概念集合,P表示本体的属性集合,R表示C上的关系集合,I表示本体的实例集合,X表示实例集与概念集的映射关系集合。

本体的属性集合P,描述概念自身的属性,称为数据类型属性(DatatypeProperty)。

本体的关系集合R,描述概念与概念之间的关系,称为对象类型属性(ObjectProperty),关系集合R中除了本体中基本的关系如part-of、kind-of、instance-of、attribute-of关系之外[4],还可根据具体的情况定义相应的关系(如上位关系,下位关系,兄弟关系等)。

“数据结构”领域本体主要由“数据结构”课程中的概念,概念间的关系及计算机可以识别的形式化描述语言组成。构建该领域本体的目标就是要形成对于“数据结构”知识组织结构的共同理解和认识,为进一步建立智能学习系统奠定基础。

2.1列出研究对象所涉及到的概念(concepts),即确定本体概念集C

分析“数据结构”知识内容[5],按照教学步骤,将知识对象进行划分,并进行抽象归纳,形成的核心概念集C为:

C={集合,线性结构,树形结构,图状结构,查找表,内部排序,外部排序,文件,基本概念,基本操作}

考虑到这些核心概念需要具体的习题资源来练习,因此增加了练习题核心概念。这些核心概念基本覆盖整个“数据结构”课程的全部知识。

2.2对概念建立类(Class)以及层级化的分类模型,即建立概念层次结构关系

(1)对已确立的核心概念进行分析整理并进一步扩展,建立整个本体概念模型。

本体概念模型体现的是概念与概念之间的父子结构关系。这个过程是一个自顶向下的过程,根据已确立的上层父类概念,逐步细化形成下一级子类[6-8]。

把数据结构知识体系、练习题作为领域本体的顶级概念,数据结构知识体系向下有基本概念、基本操作、数据结构三个核心概念。每一个核心概念又有其子概念,进一步扩展为下一级概念,如:C(数据结构)={集合,线性结构,树形结构,图状结构} C(树形结构)={树,森林}

C(基本操作)={遍历操作,转换操作,构造操作,…}

……

以此建立的概念层次结构是以树型结构呈现,具有一条明确的主线。概念之间形成的等级层次结构如图1所示。

(2)确定概念的属性P

概念的等级层次结构是本体的骨架,其血肉要通过概念的属性来充实。本文将“数据结构”领域本体中概念的属性分为数据类型属性(DataProperty)和对象类型属性(ObjectProperty)。这里所说的属性P主要是指数据类型属性。

如数据结构的知识点可以从中文名称、英文名称、难易程度、掌握程度、考试概率、上位知识、下位知识、兄弟知识、关联练习题等方面描述进行描述,因此数据结构知识体系概念的属性P为:

P(数据结构知识体系)={中文名称,英文名称,难以程度,掌握程度,考试概率,上位知识,下位知识,兄弟知识,关联练习题}练习题可以从以下六个方面来刻画:

P(练习题)={编号,题目,答案,练习题类型,练习题难度,关联知识点}

充分利用类属性继承性特性,子概念共有的属性在父概念中定义,子概念继承父概念中的所有属性,再定义自己的特有属性。

2.3加入关系(relation)连接concepts,即确定概念间的关系R

领域本体除了上面建立的类的父子关系外,还要添加符合学习步骤和学习规律的其他关系,将两个概念之间的关系称为对象属性(ObjectProperty)。

如在学叉树这一概念时,主要学叉树的概念及各种操作。因此需要有概念和操作将二叉树和对应的概念和操作联系起来。

又如按照学习规律,在学叉树之前我们应先学习树的一些知识,因此树是二叉树的前驱知识、二叉树是树的后继知识。需要用前驱知识、后继知识将二叉树和树关联起来。

前驱知识和后继知识互为逆关系。

在“数据结构”领域本体中,部分对象属性(Object Properties)如表1所示。

表1领域本体中概念的主要对象属性

2.4按照需要添加实例(instance)作为概念的具象

实例是概念的具体实体,具有概念所有属性,在添加实例前,要确定该实例的两种属性,即数据类型属性和对象属性,以练习题为例,为其添加实例,其所有属性及属性值如图2所示:

3领域本体形式化编码及开发工具

本体形式化编码阶段就是选择合适的本体描述语言来描述知识本体,现有的形式化本体描述语言很多,主要有RDF和RDFS、 OIL、DAML、OWL、KIF、SHOE等。本文选用的是OWL(Web Ontology Language)来对领域本体进行描述[9]。

目前本体的开发工具主要有Ontolingua、Ontosaurus、WebOnto、OntoEdit、Protégé等。本文选择Protégé4.1作为本研究的本体开发工具,Protégé是由斯坦福大学的Stanford Medical Information开发的一个开放源码的本体编辑器[10]。

由于篇幅有限,关于OWL及Protégé的内容这里不做具体介绍。

4结束语

本体是一种用来描述概念以及概念之间关系的模型。将本体应用于领域本体的建设,可以表示复杂的知识层次结构。更便于知识的共享,重用及推理。下一步的工作将继续完善“数据结构”领域本体。

参考文献:

[1]谢娟.教学领域本体构建研究――以“C++程序设计”课程为例[D].济宁:曲阜师范大学, 2010.

[2] PEREZ A G, BENJAMINS V R. Overview of knowledge sharing and reuse components:ontologics and problem-solving methods[C]. Stock? holm: Swtdem, 1999:1-15.

[3] A Guide to Creating Your First Ontology [EB/OL]. 2011-10-25. protege.stanford.edu/publications/ontology_development/ontolo? gy101.pdf

[4] Gruber T R. Towards Principle for the Design of Ontologies Used for Knowledge Sharing[J]. International Journal of Human Computer Studies. 1995,43:907-928.

[5]严蔚敏,吴伟民.数据结构(c语言版)[M].北京:清华大学出版社,2009.

[6]潘颖,欧启忠,肖耿毅.面向语义的课程知识本体的构建[J].电话教育研究, 2007,2:19-21.

[7]杜小勇,马文峰.学科领域知识本体构建方法研究[J].图书情报工作,2005,8(49):74-78.

[8] Boyce S. & Pahl C. Developing Domain Ontologies for Course Content[J]. Educational Technology & Society, 2007,10(3):275-288.

[9]董坚峰,胡凤.基于OWL本体的知识表示研究[J].情报理论与实践, 2010,9(33):89-92.

[10] Protégé-OWL Tutorial[EB/OL].[2011-10-24].protege.stanford.edu/conference/2005/slides/T2_OWLTutorialI_Drummond_final.pdf.