首页 > 范文大全 > 正文

基于数据挖掘的导诊专家系统结构研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于数据挖掘的导诊专家系统结构研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要: 论述了开发导诊专家系统的必要性,及导诊专家系统要具有的功能,说明导诊专家系统的知识主要来源于对各医院临床信息系统(CIS)数据库进行数据挖掘的结果,并给出数据预处理的方法步骤,最后给出导诊专家系统的结构。

Abstract: This Paper has discoursed at the necessity of developing the guidance specialist system structure, and the functions of the guidance specialist system structure, and has illustrated that the knowledge roots mainly in the results ofdata mining to the data base of hospitals’ clinical information system, and has showed the ways and steps of data pretreatment, has finally given outthe guidance specialist system structure.

关键词: 数据挖掘;导诊;系统结构

Key words: data mining;conducting-examining;system structure

中图分类号:TP315文献标识码:A文章编号:1006-4311(2010)34-0167-02

0引言

随着信息技术渗透到诊断、治疗、化验、检查等各个环节,出现了医院信息系统(HIS)、临床信息系统(CIS)、护理信息系统(NIS)、电子病历(EPR)以及医学图像存储和传输系统(PACS)等各种信息系统,能方便有效地对患者的各种数据进行采集、传输、存储,并进一步分析、处理、解释,以实现对患者的诊疗支持、决策支持、科研支持[1]。这些系统中存储者大量的相关数据,也蕴涵着不被人知的大量知识信息。这些知识信息需要通过统计和数据挖掘的方法从大量的数据中找出来。目前已有部分对这些数据进行挖掘的研究,主要有这样几个方面的应用,在医疗设备绩效预测中的应用[2],在医药信息整合方面的应用[3],在糖尿病并发症流行病学方面的应用[4],等等。这里要提出的是完全不同的另一方面的应用。

1问题的提出

对于没有医学知识的广大患者,身体出现了某种病症,就需要去医院就医。接下来的一个问题就是,应该挂什么科的号呢?对于不常见的病,患者很难确定。比如:脚肿这一病症,有很多种疾病都可能引起脚肿。当患者就诊时,对于有经验的医生,会让病人描述自身的症状,并询问可能发生的相关的症状,以了解病人的病情,并根据病情,依据自己的经验及专业知识来进行诊断。从而比较准确的判断病人的病因,在相对小的范围内再做进一步的检查,然后确定病因。如果遇到一个庸医,他会将所有可能的病因都让病人检查一遍,即浪费病人的时间,又增加病人的经济负担,有时还会延误病人治疗的最佳时机。事实上在医院的临床信息系统(CIS)中存在许多有用的知识信息,如果能将这些有用的知识信息挖掘出来,并生成一个网络导诊专家系统,提供给广大患者使用,患者可以根据自己的症状,利用导诊专家系统,初步确定病因,再去医院就诊。这样即减轻了患者的经济压力,又提高了效率,节约患者大量的时间,同时也减轻医院患者太多的压力。

2系统结构

导诊专家系统应具有以下功能:

对用户选定或输入的一个或多个病症,导诊专家系统能提出相关病症的询问,当用户回答了相关询问后,导诊专家系统可给出:①一个或多个可能的病因,最有可能的排在第一位,依此类推;②各种可能病因对应的科;③可能的发展趋势;④相关的饮食及体育锻炼等方面的建议。

以上提到的这些信息除④之外,其它信息均可对医院的临床信息系统(CIS)数据库挖掘得到。

2.1 数据来源由于患者一般不会始终在同一家医院就诊,要从临床信息系统(CIS)中挖掘出某病症可能的发展趋势,数据就不能只取自同一家医院,而应该取自同一地区的所有医院,一个市或一个省的所有医院,这样才可能含盖每一个患者就诊的所有信息,从而可挖掘出某病症可能的发展趋势的信息,也可以判断出患者针对某病症的某次就诊是否治愈,如果没有治愈,患者会再次针对该病症就诊,当然不一定在同一家医院。

2.2 数据预处理利用数据挖掘技术从长期积累的、大量的临床数据中发现有效的行为模式是生成导诊专家系统的关键。而取自不同医院的数据往往是不完整的、有噪声的和不一致的。直接用于挖掘将产生大量不正确的和无意义的知识信息。如何进行合适的数据预处理,提供符合挖掘需要的干净且严谨的数据是发现高质量知识信息的关键[4]。临床数据的特点:在性别、年龄、科室、用药项目、病症、临床行为等繁多属性中存在冗余、无用的属性及无挖掘意义的行为;需要通过合适的预处理方法确定行为间的关系,进而规范数据形式为后续挖掘工作奠定基础。

由于挖掘的目标不同,所要做的预处理也不同。针对导诊专家系统的挖掘目标所要做的数据预处理,归纳起来有以下几点:①对于取自不同医院的原始临床医学数据,以患者的身份证号码属性作为识别不同患者的标识,对每位患者的就医记录,以时间的先后顺序形成一个序列。②对每位患者的就医序列记录做去噪处理,以患者的姓名,年龄等属性作为去噪的依据。比如:同一序列中有不同姓名的记录,则根据年龄、职业等属性推断是姓名有错,则修正其姓名,否则是身份证号码属性错误,则做去噪处理。③对每个序列中与挖掘目标无关的就医记录做去噪处理。④对于序列中只包含一到两个就医记录的患者数据,并且记录的病症与挖掘目标无关,如:外伤处理等,做去噪处理。⑤对就医记录与挖掘目标无关的属性作去噪处理,如:姓名等。

2.3 数据的隐私保护医学数据不可避免地涉及到患者的一些隐私信息,当这些隐私信息使患者在日常生活中遭遇到不可预料的侵扰时,就产生了隐私性问题。医学数据挖掘者有义务和职责在保护患者隐私的基础上进行科学研究,并且确保这些医学数据的安全性和机密性[5]。

在这个系统中,在对数据预处理完成后已将患者的姓名去除,而挖掘出的数据只包含与导诊有关的知识信息,不包含患者的身份证号。这样可对患者的隐私达到有效的保护。

2.4 数据挖掘根据确定的挖掘目标选择合适的挖掘工具对预处理后的数据进行挖掘,挖掘得到的结果作为导诊专家系统的知识信息库。由于医院的临床信息数据库中的数据是随时间变化而不断增加的,所以需要定期对新增的数据作预处理并进行增益挖掘,从而保证导诊专家系统的知识信息库的知识信息完整及新鲜。

2.5 导诊专家系统结构导诊专家系统结构如图1所示。图中的数据库1、数据库2、……、数据库n代表各医院的临床信息数据库,用户1、用户2、……、用户m代表广大患者。基于Web的导诊专家系统门户模块包含对挖掘得到的知识信息的可视化表达。

3结束语

这一系统的实现,需要由政府部门出面,组织一个包括人工智能专家、数据挖掘专家、网络专家、医学专家、统计学专家等的队伍,购买相应的设备及软件,可以先在某一个省或市进行试点,待成熟后再推广到其它省市。这一系统的实现,将给广大民众带来极大的方便,也是市政建设的一项业绩。

参考文献:

[1]张萌,梁正,祝思清.基于关联规则的数据挖掘在医疗诊断中的应用[J].山东科学,2008,(1):80-82.

[2]伍平阳,林意群,林木炎.基于数据挖掘技术的决策树算法在医疗设备绩效预测中的应用[J].中国组织工程研究与临床康复,2008年,(12)9:1689-1692.

[3]王欣.利用数据挖掘技术进行医药信息整合[J].齐齐哈尔医学院学报,2009,(30)11:1381-1382.

[4]王珏,杨鹤标.临床行为模式挖掘的数据预处理[J].计算机工程与设计2009,30(2):374-377.

[5]袁占花,李祥生.数据挖掘在医学信息系统中的应用[J].电脑开发与应用,2009,22(7):55-57.