开篇:润墨网以专业的文秘视角,为您筛选了一篇中医药本体工程研究现状范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
DOI:10.3969/j.issn.1005-5304.2013.07.051
中图分类号:R2-03 文献标识码:A 文章编号:1005-5304(2013)07-0110-03
本体(Ontology)是针对领域概念体系的精确规范,用以指明概念的定义以及概念之间的语义关系。它能使交互各方对特定领域内共用的概念、词汇以及概念分类达成一致,支持知识的共享和重用,解决系统之间的互操作问题。近年来,本体工程成为中医药领域广泛关注的研究热点[1]。笔者围绕中医药本体工程,通过查阅近10年相关文献,探讨中医药本体工程的方法、技术、覆盖范围和应用,以期为中医药本体开发人员提供参考。
1 概述
中医药学历经数千年的发展,形成了一套完整的知识体系。中医药信息学的一个核心任务,是实现中医药知识体系的数字化,从而面向中医团体提供准确、详实的知识服务。中医药知识资源具有鲜明的中国文化特征,包含大量古汉语成分,难以精确描述。现代医学所使用的知识建模方法并不完全适合于中医药领域。因此,迫切需要提出创新的知识建模方法,以支持中医药知识的数字化建设。
近年来,学者们开始尝试基于领域本体,研制符合中医药领域特点的知识表达框架,解决中医学知识的获取、分析和推理等问题,包括在国家知识基础设施(National Knowledge Infrastructure,NKI)的建设过程中,构建了中医领域本体,如中医诊断方法、中医术语、中医证候、中医脉象、中医病机等30多个中医本体类,用于实现中医学知识的获取、分析和推理[2-3]。尹氏等[4]针对中医药术语标准化过程中面临的问题,使用本体工程方法,研制了中医药学语言系统(TCMLS)。此外,本体还被用于阴阳理论[5]、五行理论[6]、中医诊断[7]、证候学[8]、
基金项目:国家科技重大专项-重大新药创制(2009ZX09301- 005-01);国家高技术研究发展计划(2006AA01A122);第52批中国博士后科学基金面上项目(2012M520559);中国中医科学院基本科研业务费自主选题项目(zz060303)
通讯作者:崔蒙,E-mail:
中药学[9]、方剂学[10]、治则治法[11]、针灸学[12]、中医古籍[13]等领域的知识建模和知识获取。这些研究表明,领域本体为中医药知识体系的形式化表达和系统管理提供了一种有效手段。
2 中医药本体工程方法学研究
本体工程多是面向特定领域开展的,其方法在各个领域中不尽相同。中医药领域的本体建设仍处于起步和探索阶段,其方法学体系尚未成熟、亟待完善。目前,国内外尚缺乏构建中医药领域本体的成熟流程、方法和标准规范。中医药领域的知识体系独具特色,极为复杂。中医药本体建设必然是一项复杂的系统工程,涉及中医团体的广泛参与和密切协作。若没有合适的方法学作为指导,就难以在不同的本体工程中贯彻一致的设计原则,这不利于本体的规模化和互操作。因此,需要对中医药本体工程方法学进行深入研究。
在方法学研究中,学者们首先提出了一些构建中医药本体的基本原则。如林氏[10]提出对中医药概念的表达不必单纯强求标准化和一致性,而应在本体的启发和应用上,完整、忠实、准确地表达中医药传统理论的语义,并做到机读、通用、可共享,为实现中医药资源数字化奠定基础。方氏[14]提出,中医药本体的建立必须在深入理解中医药领域知识的基础上进行。这些原则对本体工程的实施都具有指导意义。
本体工程方法学中的一项关键任务是顶层本体的设计。中医顶层本体不仅为中医本体的构建提供了框架,而且有利于实现中医本体同其他领域本体之间的整合,是构建完整中医本体的基础。高氏等[15]对中医顶层本体的构建做了初步探索,并指出中医顶层本体必须包括一般科学的概念接口、一般生物医学的概念接口和中医的最高层的抽象概念。另外,TCMLS的语义网络中包括层次化的语义类型和通用的语义关系,为TCMLS的构建提供了框架,也可被视为一个顶层本体[16]。
TCMLS是在本体论指导下构建的大型术语系统,旨在提供一套计算机化的术语系统,支持中医药数字资源的系统整合和深度利用,向中医团体提供开放、智能的知识服务[4,16]。方氏[14]提出了一套基于本体构建TCMLS的方案,其中涉及本体类及其层次结构、语义系统、概念集合、术语规范、通用编码等诸多方面,并提出了本体规范存储和查询的方法,以帮助用户管理和获取中医药信息。曾氏[17]论述了TCMLS的构建思路、设计原则、架构与方法,包括术语及定义的采集范围及标准、定义类(Class)和类的层次结构(Hierarchy)、语义关系等。谢氏等[18-19]对TCMLS的语义网络作了深入分析,并将其与一体化医学语言系统(UMLS)的语义网络进行了比较研究。汤氏[20]提出了面向中医药本体工程的协作方法,据此构建了TCMLS的共建平台。Mao等[21]提出基于子本体模型的本体演化方法,并将该方法应用于TCMLS的管理和重用。TCMLS的建立是一种创新性工作,对中医药学数字化、标准化的实现具有重大意义。在目前国内外缺乏构建领域本体的成熟流程、方法和标准规范的状况下,TCMLS为中医药本体工程方法学的完善与发展作出了贡献。
构建大型领域本体需要耗费大量的人力资源。为降低成本,学者们开始研究领域本体的自动构建方法。刘氏等[22]利用自然语言处理技术对中医药领域中已有的公认领域知识进行了重构与利用,并利用领域专家知识实现了受限文本的本体自学习机制,从而成功实现了中医药学知识描述体系的自动构建与获取。这项工作初步证明了中医药本体工程自动化的可行性,为解决本体构建的瓶颈问题提供了另一途径。
3 中医药本体的覆盖范围
如上所述,本体技术已被引入中医药的诸多领域,在知识建模和获取中发挥了重要作用。李氏等[8]分析了证候的语义特点,将证候的组成要素拆分成中医意义下的基本语义单元,对语义单元如何组合成证候名称的规律进行了探讨,并在此基础上构建了证候本体。曹氏等[7]在NKI本体的基础上构建了中医舌诊本体,该本体划分为“舌质”和“舌苔”2类:在“舌质”类下建立了“舌神”、“舌色”、“舌形”、“舌态”4个子类;在“舌苔”类下建立了“苔质”和“苔色”2个子类。该本体已被用于中医舌诊知识的获取。
在中药方剂学领域,周氏等[9]构建了面向中药学的领域本体,以全面描述中药的本质,揭示中药本身及中药间复杂的功效与物质关系,澄清中药的知识结构,为中药的知识表达提供数据基础;林氏等[10]在分析中医药领域概念表达的特点和中医药检索的现状的基础上,尝试建立了方剂学本体,其内容包括方剂分类、主治、功效、禁忌、配伍等。
此外,高氏等[5]对气的失常与阴阳失调病机的逻辑联系进行了本体建模;朱氏等[12]基于语义网络技术研发了面向传统针灸知识体系的顶层本体;吴氏等[6]对五行理论及其在中医临床中的应用方法进行了本体建模;于氏等[23]对中医基础理论体系进行了本体建模;纪氏等[24]探讨了基于本体理论的针灸学知识组织方法,初步建立了一个针灸学领域本体框架,并验证了该本体应用于古籍检索的可行性;李氏等[25]参照中医脑病学的理论体系,复用已有中医学本体和国外生物医学领域本体,构建了包括概念及其概念间相互关系在内的中医脑病学本体。
领域本体在中医药国际化方面也发挥了作用。如韩国Jang等[26]构建了面向“传统韩国医学”的本体,描述了药材的名称、用药部位、功效等知识,并刻画了药材、症状、疾病和疗法之间的关系。该本体中包含60000多条陈述,这些知识是由领域专家从韩国药典、传统医学经典和教材中获取的。这项工作对于加强国际社会对中医的理解和认识、促进中医药国际化进程具有重要意义。
4 中医药本体的主要应用
近年来,中医药本体被广泛用于从文献等知识资源中获取中医药结构性知识。中医知识获取是计算机自动实现知识管理、知识重组的前提,也是知识工程领域的一个难点问题。郑氏等[27]采用本体技术及数据挖掘分析技术,通过对中医医案与中医经典著作文献进行关联研究分析,实现了名老中医的知识获取和传承。蒋氏等[28]提出了一种基于领域本体的知识获取方法,对医案中蕴含的知识进行形式化表示,构造中医领域的语义网络,对其进行定量分析,抽取中医领域的概念语义场。刘氏等[29]提出了一种新颖的中医专家临床病案的知识获取方法,这种方法基于中医学本体,通过电子病案获取专家丰富的临床经验和诊疗知识,并将病案蕴涵的知识转化为形式化的知识,存入NKI知识库和NKI病案库。
中医药本体也为中医药古代文献的数字化作出了贡献。朱氏等[13]构建了面向中医古籍的语言系统(包括语义类型和语义关系)。林氏[30]从收集的中医骨伤资源(主要是中医骨伤古籍)中提取骨伤相关的术语,然后设计本体的框架并构建了中医骨伤古籍小本体。谷氏[31]基于中医古籍文献叙词表,构建了面向中医古籍文献的领域本体。这些本体已被用于从中医古籍中获取结构性知识,从而支持古籍的语义检索和深入分析。
构建中医药本体的另一个重要目的,是解决中医领域知识同其他领域知识的融合,以及中医领域知识内部的融合问题。在中医药领域中,存在大量富含中医药领域知识的数据库,但它们之间存在严重的异构性,这增加了中医药知识融合的难度。Chen等[32]基于领域本体实现了中医药异构数据库的集成,从而将中医各科知识融合为计算机化知识体系,以支持知识的统一访问。此外,中医药领域本体在知识检索[30]、专家系统[33]、中医百科[34]、智能系统[3]等诸多领域得到了广泛的应用。
5 小结
本体是一种新型的知识组织技术,主要源自人工智能(尤其是知识表达与推理)领域,也涉及到哲学、语言学、术语学和认知科学等。近年来,本体成为中医药领域广泛关注的研究热点。中医药学是一个复杂而全面的知识体系,具有复杂的概念层次结构和网状的知识结构,并且与其他的自然、人文学科之间存在着交叉融合的关系。传统的知识组织系统结构简单、表达能力有限,无法完全解决中医药知识表达中的复杂问题,而本体为解决这些问题提供了强大的知识表达和推理能力。上述研究表明,领域本体能够准确定义中医药领域概念,系统表达它们之间复杂的语义关系,并支持知识展示、决策支持、知识发现等中医药应用。
参考文献:
[1] 李兵,裘俭,张华敏,等.中医药领域本体研究概述[J].中国中医药信息杂志,2010,17(3):100-101,106.
[2] 曹存根.国家知识基础设施的意义[J].中国科学院院刊,2001,16(4):255-259.
[3] 曹宇峰.病案分析引导下的中医智能教学的研究[D].北京:首都师范大学,2005.
[4] 尹爱宁,张汝恩.建立《中医药一体化语言系统》[J].中国中医药信息杂志,2003,10(3):90-91.
[5] 高博,崔蒙,宓金华,等.气的失常与阴阳失调病机的逻辑联系及三维展示模式[J].中国数字医学,2010,5(5):50-53.
[6] 吴朝晖,陈华钧,姜晓红.Modern computational approaches to traditional Chinese medicine[M].杭州:浙江大学出版社,2012:109- 124.
[7] 曹宇峰,曹存根.基于本体的中医舌诊知识的获取[J].计算机应用研究,2006,23(3):31-34.
[8] 李明.证候本体的构建及其应用[D].上海:上海中医药大学,2009.
[9] 周扬,王振国.中药Ontology概念关系体系的构建探析[J].中国中医药信息杂志,2009,16(3):96-97.
[10] 林丹红,钟伶.Ontology在中医药概念表达中的研究[J].医学信息学杂志,2007,28(6):545-549.
[11] 侯玉,张昌林,车立娟,等.构建中医治则治法本体的研究[J].数理医药学杂志,2010,23(5):603-606.
[12] 朱玲,崔蒙.传统针灸知识体系语义网络的构建探讨[J].中国数字医学,2010,5(5):47-49.
[13] 朱玲,崔蒙,贾李蓉,等.中医古籍语言系统中的语义类型分析研究[J].中国数字医学,2012,7(4):5-7,14.
[14] 方青.基于本体论的中医药一体化语言系统[D].杭州:浙江大学, 2004.
[15] 高成勉,包含飞,,等.本体构建原则及其在中医顶层本体构建中的应用[J].医学信息,2008,21(5):581-583.
[16] Zhou X, Wu Z, Yin A, et al. Ontology development for unified traditional Chinese medical language system[J]. Artif Intell Med, 2004,32:15-27.
[17] 曾召.本体论在中医药学语言系统中的应用研究[J].中华医学图书情报杂志,2007,16(1):4-6.
[18] 谢琪,崔蒙,曹存根,等.基于领域本体方法构建中医概念信息模型的思考[J].世界科学技术―中医药现代化,2009,11(4):621-625.
[19] 谢琪.基于本体方法构建中医药概念信息模型的方法学示范研究[D].北京:中国中医科学院,2011.
[20] 汤萌芽.中医药本体工程及相关应用[D].杭州:浙江大学,2007.
[21] Mao YX, Wu ZH, Tian WY, et al. Dynamic sub-ontology evolution for traditional Chinese medicine web ontology[J]. Journal of Biomedical Informatics,2008,41(5):790- 805.
[22] 刘耀,穗志方,周扬,等.中医药本体构建研究[J].大学图书馆学报, 2008,26(4):58-62.
[23] 于琦,崔蒙.中医基础理论体系知识表示[J].中国数字医学,2010,5(5):25-26,29.
[24] 纪军,徐鸣曙,杨韵华,等.针灸学领域本体构建研究[J].医学信息学杂志,2008,29(5):25-28.
[25] 李毅,张梅奎,杜侃,等.中医脑病学本体的探讨及其构建[J].世界科学技术―中医药现代化,2007,9(6):96-101.
[26] Jang HC, Kim JY, Kim SK, et al. Ontology for medicinal materials based on traditional Korean medicine[J]. Bioinformatics,2010, 18(9):2359-2360.
[27] 郑健,林丹红,李其铿,等.基于本体的名老中医医案研究应用系统[J].福建中医学院学报,2008,18(6):48-50.
[28] 蒋宏潮,王大亮,张德政,等.基于领域本体的中医知识获取方法[J].计算机工程,2008,34(12):16-18,21.
[29] 刘和洋,曹宇峰,秦丽娜,等.基于本体的中医专家临床病案的知识获取方法[J].计算机系统应用,2005,15(8):80-83.
[30] 林尔正.基于中医骨伤古籍本体的语义检索研究[D].福州:福建中医学院,2008.
[31] 谷建军.基于叙词表的中医古籍文献领域本体建模方法研究[D].北京:中国中医科学院,2006.
[32] Chen HJ, Mao YX, Zheng XQ, et al. Towards semantic e-science for traditional Chinese medicine[J]. BMC Bioinformatics,2007, 8(Suppl 3):S6.
[33] 张德政,彭嘉宁,范红霞,等.中医专家系统技术综述及新系统实现研究[J].计算机应用研究,2007,24(12):6-9.
[34] 宓金华.中医药知识工程应用[D].杭州:浙江大学计算机科学与技术学院,2010.
(收稿日期:2012-10-12,编辑:梅智胜)