首页 > 范文大全 > 正文

中医喘证医案的本体表示及知识库架构

开篇:润墨网以专业的文秘视角,为您筛选了一篇中医喘证医案的本体表示及知识库架构范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:中医医案是名老中医学术思想的精华和临床用药经验的记载,是医学传承的宝贵资源。然而中医医案丰富庞杂,多为非结构化知识,需要有效的知识表示方法和高效重用的知识库支撑。本文将信息工程学知识引入中医信息化建设,应用领域本体理论对中医喘证知识进行形式化表示,进而构建中医喘证知识库,为中医流程和中医标准化提供技术途径,为中医信息化研究和临床经验传承提供可行的思路和方法。

关键词:中医医案;领域本体;喘症;知识库

中图分类号:TP182;TP315 文献标志码:A

中医医学历史悠久,同时也产生了与中医学有关的大量文献。在中医学走向现代化的过程中也产生了海量科学研究数据和文献,但是这些资料存在着分散、片面等状况不能被有效地利用。由于历史的久远和中国地域的辽阔,同一事物在不同时期、不同地域有着不同的名称,更是加大了实现古医学与现代医学资源共享的障碍。

语义检索可以通过从语义网上获取数据从而给出与检索者请求的查询结果以及请求的相关资源,从而解决了关键词一词多意或多词一意等局限性,提高了检索的准确性和全面性,实现了机器理解与人机交互的协同能力[2]。在基于本体的检索系统中,领域本体[3-4]的Ontology层提供共享的术语和概念,而知识库则使用这些语义的共享来表达领域事实,因此本体层是语义搜索引擎的关键所在。本文引入信息工程的知识库架构和基于领域本体的知识库构建理论,将中医喘证知识作为形式背景,使用Protégé 工具及OWL 语言构建了基于中医喘证本体的领域知识库实例,解决了案例知识的表示和组织问题,为下一步中医喘证案例推理的研究奠定基础。

1知识库

知识库是针对某一领域问题求解的需要,采用某种知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识的集合[5]。

领域知识是指在某一专门领域中重要问题或概念以及概念之间的相互关系的集合。领域知识库这一术语源于人工智能领域。在人工智能领域,领域知识主要应用于知识的专家系统和自然语言理解的系统中。

1.1知识 目前,知识这一概念有3种比较有代表性的定义:①Feigenbaum:知识是经过消减、塑造、解释、选择和转换的消息。②Bernstein:知识是由特定领域的描述、关系和过程组成。③Heyes-Roth:知识=事实+信念+启发式。知识常常是模糊、不确定或不完全的。而且知识还处在不断地动态变化过程中。

对于任何知识,通常采用Heyes-Roth提出的知识的三维空间来描述。即知识的范围、知识的目的和知识的有效性。范围由具体到一般,目的从说明到指定,有效性由确定到不确定。知识的三维空间描述,见图1。

图1 知识的三维空间描述

大量的数据经过加工后才会有价值,经过分析处理的数据形成了信息,信息的作用后有时间和范围的限制。为了使信息在较长的时间内有效,必须进行一系列的内部处理,这个过程叫综合,综合后的信息组成了知识。

从计算机科学的观点来看,知识是信息综合处理的结果。在综合过程中,信息传递相互比较,结合成有意义的链接。数据、信息和知识具有层次关系,它们的层次关系,见图2。

图2 数据、信息和知识的层次关系

1.2领域知识 领域知识主要应用在基于知识的专家系统和自然语言理解以及有关概念的约束的集合。知识工程对领域知识进行了3方面的描述:①领域知识是一个概念模型,这个概念模型包括概念和概念之间的关系。②领域知识是概念和概念之间的约束。③领域知识是陈述如何推导计算出新概念和新概念之间的关系的规则。

领域知识的2个基本概念:①领域特征概念:是领域知识的概念化,是各种相关领域内的重要概念的语义描述。②领域特征属性:是指某一领域内的概念所具有的特点,领域特征概念可以是词,也可以根据需要扩展成短语甚至词串。

2本体

2.1本体的概念 本体原本是一个哲学上的概念,在被引入信息科学之后,其定义尚未统一, Studer在1998年对本体的定义得到最多认同,他提出"本体是共享概念模型的明确的形式化规范说明",此定义包含4层含义:①概念模型:本体论的研究对象;②明确:某套概念及其相互之间关系被准确定义;③形式化:计算机可读的精确的形式化描述;④共享:本体中反映的知识是相关领域中公认的概念集。

2.2本体构建步骤 以本体构建[6-8]原则[清晰(Clarity)、一致( Coherence)、可扩展性(Extendibility)、编码偏好程度最小(MinimalEncoding Bias)、本体约定最小(Minimal Ontological Commitment)]为基础,国内外学者提出了一种构建本体的实际操作方法,归纳为两种模式:①利用现有文献和领域专家使用手工的方式创建概念关联;②将已有的叙词表改造成本体,或者采用学习机制,进行自动或自动化的本体构建。

目前国际上被认可的本体手工构建方法主要包括有骨架法、企业建模法、Methontology、KACTUS、循环获取法、IDEF-5、七步法等本体构建方法。

本文架构的中医喘症知识库即采用七步法构建本体。

2.3本体构建工具 目前构建本体的工具有很多种,不同的专业领域选取不同的本体构建工具,本文选择由斯坦福大学研制开发的Protégé(使用Java和开放资源作为操作平台)作为本体的建模工具,OWL(Ontology Web Language)作为描述本体的语言。Protégé提供了本体概念类,关系,属性和实例的构建,并且屏蔽的具体的本体描述语言,只需在概念层次上进行本体模型的构建。

3中医喘证医案的本体和知识库构建

3.1中医喘证医案的研究背景数据整理 收集和整理《吴鞠通医案》、《丁甘人医案・伤寒案》以《中华医典》所收录的75部医案著作中所涉及的喘证医案为研究对象[9],以"喘主证"、"喘息"、"喘逆"、"喘鸣"、"咳喘"、"上气"等关键词为核心概念,筛选整理医案,最终确定相关属性字段10余个,建立了较为完善的中医喘证医案数据库,如图3所示,将此作为研究对象的形式背景,见图3。

图3 喘症医案数据库

3.2形式背景中概念树的组织

3.2.1定义类及层次关系 从喘证本体中自上而下抽象出基本类及层次关系,并采用Protégé建立中医喘证领域本体类关系初步模型。其中,类对应本体体系中的Class,对象对应本体体系中的Instance或Individual例如,外感型喘是实喘的子类,实喘又是喘证的子类,用OWL描述上述关系具体如下。

3.2.2定义并应用各类之间的关系 每种关系相当于一个二元组或多元组函数,各函数的定义域和值域为喘证本体模型内部的各本体类和子类对象,可分别由各关系所对应的ObjectProperty属性的domain和range两个子属性来设置函数的定义域和值域,以便于本体模型内部各类通过上述关系进行关联,以下显示的是ObjectProperty属性"痰象"以及它的特殊性质,其中"痰象"的定义域是案例,值域是由"痰白"、"痰黄"和"痰清稀"组成的并集构成,说明案例是由值域中的3部分构成的,同时它还具有传递属性()

3.2.3设置各本体类的属性及关系 包括各属性的名称、值、类型及其他约束,对应本体体系中的Datatype Propety。

属性是个体间的二元关系,也就是说,属性把两个个体连接在一起。

本体所描述的概念间的关系主要有4 种:①概念之间部分与整体的关系(Part of);② 概念之间的父子继承关系(Kind of);③概念的实例和概念之间的关系(instance of);④某个概念是另一个概念的属性关系(attribute of)。

概念间的内在联系构成了丰富的概念间的语义关系,通过规则的逻辑推理就能获取概念间的蕴涵关系。

3.2.4定义概念的语义扩展关系如同义、近义、上下位关系等。为了实现关键字的语义检索,本体模型需要实现词语的本义、同义、近义和上下位等关系查询。例如,"微喘"可以具有"喘息"等同义词或近义词,若把其中任何一词作为关键词输入,不仅可以得到关键词的本义信息,并且能查询到关键词的同义、近义信息。这也是将来提高案例检索查全率的关键技术。

3.2.5实例填充 用具体实例填充(1)中定义的类,并对实例的属性及其属性值进行定义和扩展。

3.2.6修正本体模型 采用Jean推理机对已构造本体进行推理,验证本体初步模型是否合理性以及概念是否具有可满足性,并完善不合理之处。

3.2.7设置本体的存储方式。本体存储主要有文件存储和数据库存储两种方式,文件存储指以OWL或RDF等文件格式存储。喘证本体模型以OWL的文件格式存储,知识库中的案例数据以关系数据库形式存储。

应用Protégé工具建立的中医喘证本体片段,见图4。

图4 中医医案喘证本体片段

3.3导出owl本体文件 目前,Protégé 中存在4 种文件类型,本文选择OWL RDF files,导出的本体文件可以支持OWL 浏览和编辑的工具中被保存、阅读和修改,为知识推理[11-12]和检索提供了资源描述。中医喘证医案本体的概念集合语义树,见图5。

图5 中医喘证医案的概念模型

4结论

本体技术作为一种新的知识组织工具,可以多维度、可视化、动态地表示和组织中医知识和相关的信息资源,基于本体的领域知识库可以清晰地表达领域知识的基本概念、属性、处理方法和内在关系,使用这些概念可以完成知识表示和语义推理。本文将本体技术应用于中医喘证的知识库构建,是下一步实现中医喘证的知识检索和案例推理的前期关键工作,旨在为中医信息化和知识传承探索一条新途径。

参考文献:

[1]田甜,高思华.本体在中医药学领域的应用现状及展望[J].中华中医药杂志,2013,(6):1832-1834.

[2]许德山,张智雄,邢美凤.面向本体知识库的可视化检所研究[J].信息系统,2010,(8):114-117.

[3]李景,孟宪学,苏晓路.领域本体的构建方法与应用研究[M].北京:中国农业科学技术出版社,2009:7.

[4]曾召.构建中医药学领域本体的实践[J].中华医学图书情报杂志,2009,(7):1-5.

[5]马晓丹,邓晓楠,彭文娟,等.基于领域本体的知识库架构和实现[J].河北联合大学学报,2012(10):42-47.

[6]高成勉,包含飞,.本体构建原则及其在中医顶层本体构建中的应用[J].医学信息学,2008,(5):581-583.

[7]李兵,裘俭,张华敏.中医药领域本体研究概述[J].Chinese Journalof Information on TCM,2010,(3):100-106.

[8]张继芳.基于本体的教学领域知识库构建及应用[J].时间与经验,2011,4:58-61.

[9]阎红灿,李丽红,马会霞,等.基于粗集理论的中医喘证临床医案关联规则分析[J].辽宁中医杂志,2012(7):1218-1220.

[10]于楠.基于Ontology的领域知识层次分类体系的构建[J].东北大学,2005.

[11]KIM J Y,JEONG D W,BAIK D-K.Ontology-based semantic recommendation system in home network environment[J].IEEE Transactions on Consumer Electronics,2009,55(3):1178-1184.

[12]KNAPPE R,BULSKOV H,ANDREASEN T.Perspectives on ontology-based querying:research articles[J].International Journal of Intelligent Systems,2007,22(7):739-761.