首页 > 范文大全 > 正文

医学统计典型错误辨析

开篇:润墨网以专业的文秘视角,为您筛选了一篇医学统计典型错误辨析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:统计方法在医学上的应用渗透到医学发展的方方面面,正是因为统计学如此强大的渗透性,反而引起一些医学实例中统计学知识被误用,推导出错误的医学结论,为医学的进一步发展带来一定程度的隐患。本文从医学论文中常见的典型错误展开讨论,辨析其造成错误的原因,并对正确的在医学实验中运用统计学方法给出一定的建议,具有一定的参考价值。

关键词:医学实验;统计方法;典型错误

引言

随着近年来,人们对统计学知识研究的不断深入,统计学方法被不断应用在各个学科的发展中,其中以经济学和生物医学表现尤为明显。选取正确的统计学方法帮助医学实验推导结果,是目前医学科研发展的一项重要的工作。是否选取正确的统计方法将直接对医学科研发展中的的严谨性造成影响,方法选取正确可能带来较高价值的医学结果,而选取不当则会使得其反,甚至得出与事实严重相悖的结论。但是,并不是所有的医学工作者都对这一观点有着较高的认知水平,在实际工作中,忽视统计学知识的重要性和科学性的实例层出不穷,某些研究人员滥用统计学方法,甚至未经科学验证就在文章里叙述“采用某检验的统计方法进行分析”,这些都造成了目前医学实验中统计方法应用较为混乱的问题。甚至存在,某些医学文献中盲目参考前人统计学资料和结论,没有深入理解,得出让人啼笑皆非的结论。本文从医学实验中常见的几个统计学错误:统计学表达描述出现问题、使用单因素方法考虑多因素问题、盲目套用统计分析模式以及不考虑统计推断方法使用的前提条件出发,讨论错误的成因,并就如何避免此类错误给出一点建议和对策[1]-[3]。

一、统计学表达和描述方式存在错误

在对医学实验的分析中,往往不可避免的要对所收集的众多数据进行某种意义的表达和描述,尽管常见的表达和描述方法所有人都会,看似这是一件很容易的事情。但是,一旦应用到统计学的知识,很多人就会不可避免的犯各类错误。常见的表达和描述错误有以下几个方面:第一,在统计表方面,表中纷繁的数据并没有给出一个合适的表达对其进行描述,容易使人造成误解;第二,在统计图方面,刻度值是极其容易出现错误的一种情况,此外,错误使用不能表现所需表达性质的图表的情况也较为常见;第三,在定性资料和定量资料的分析过程中出现表达错误;第四,在对定量资料进行描述的时候,不考虑其是否偏离正态分布,,不考虑标准差与平均值的关系,一味的使用x±s表达等等。

以某篇医学文章中的应用为例,展开讨论:在该论文中,用下表描述定量资料。

表1 两类奶牛乳蛋白含量比较(%)(x+s)

按照表中数据描述,是应用平均数以及标准差来有效的描述资料的,看似科学并且有理有据,但是经过与下表2的对比分析,却会发现,如下情况:

表2 两类奶牛乳蛋白含量比较(%)(x+s)

表中存在标准差大于平均值的情况,显然可以判断数据不符合正态分布的规律性,此时若继续按照之前的方式描述数据,就会产生错误。相反,如果此时将标准差变为变异指标,从而有效表达资料情况就相对比较合理,而且更有利于过程中问题的发现。

二、盲目使用单因素统计思想考虑多因素问题

这一问题多出现在列联表的相关资料和问题当中,在这类问题中,可能对结果变量造成影响的因素并不是单一的,并且和可能各因素之间也存在交叉的作用。在这种情况下,如果盲目采取化繁为简的方式,将所需要的资料化简成最简单的二维列联表的形式,进而采取最为常见的卡方检验对数据进行分析,就可能造成错误。在笔者刚接触此类医学实验的时候,通常假定各因素具有独立性,在这一前提下,上述方法是合适的,但是,如果没有这一前提存在,各因素之间存在或浅或深的相互联系,就将会得出错误的结论。例如在某一篇医学论文中,作者写作的本意是分析不同年龄段、性别以及身体状况的人对某一病毒抵抗力的差异,然后分别针对三个因素各自整理一个列联表并进行卡方检验,然后开始数据统计分析的工作,并得出自认为比较满意的结论。但是仔细推敲,其实三个因素的独立性并没有得到正确的验证,这样盲目的分离数据的措施是相当不具有科学性和合理性的,统计分析的结论也可以说是完全没有说服力的结论。当然,从统计学角度来说,我们也并不能完全否定上述结论,只能说上述结论也是具有一定的参考价值的,正确的做法应该是:采用logistics回归模型进一步对相关因素进行筛选,取代单一的卡方检验方式。

三、盲目套用统计分析的模式却并没有实质性的分析

发展到现在,统计方法已经拓展的多种多样,比较常用的有卡方检验、t检验、因子分析、方差分析、回归分析等等,每一种统计方法都有其对应的特殊意义。有一些统计方法的作用只是单纯的为了判断某两种因素是否存在关联性,有一些方法则是用来比较两组数据是否存在较为明显的线性趋势,此外还有一些统计方法可能只是为了筛选出影响数据结果的最重要因素……很多医学论文中甚至没有搞懂不同统计方法的基本区别,就盲目套用统计分析的模式进行分析,不重结果只求分析过程的花样性,这完全丧失了统计学方法在医学实验中应用的意义。例如,在某医学实验的相关论文中,作者希望分析老年人的最大呼气流量与工作能力的关系,最终却选用了卡方检验的方式,得出二者之间间是否具有独立性的结论,完全与作者本意无关,既不能得出有效结论,还造成了论文表述的繁琐冗长,一定程度上还增加了作者的工作量。此时正确的想法应当是检验上述二者是否具有一致性的关系,所以采取比较常见的一致性检验措施更为有效和必要,例如在这篇文章中就可以采用Kappa检验,随之也将取得更为理想的结果。

四、忽视统计方法使用的前提

通常情况下,统计方法的应用都应当是考虑其适用的前提条件,例如在我们比较常用的一些统计方法应用在医学实验的实例中的情况,都是先考虑其前提条件是否适合,再进一步进行统计推断的:t检验就是最为常见的例子,采取t检验进行统计分析前,必须保证所参与比较的两组数据是服从正态分布的,此外方差齐性也是必须要满足的条件之一。如果不能够满足统计方法使用的前提条件而盲目应用统计推断的方法,必然带来不够严谨的实验结论。在某些情况下,如果某一种方法的前提条件并不符合,我们可以考虑换一种可以替代该方法的统计推断方法,比较常见的有,在使用卡方检验前,如果发现资料中的样本总数,不能满足卡方检验的最低要求,则可以考虑换成fisher精确检验法重新进行分析,对应的,将会取得更为严谨有效的结论。

五、结束语

上述四种错误,统计学表达描述出现问题、使用单因素方法考虑多因素问题、盲目套用统计分析模式以及不考虑统计推断方法使用的前提条件,造成的各类错误显而易见,而在实际的医学实验运用统计方法的例子中,还会出现其他各类可能的错误。例如,对资料的设计类型没有分辨清楚,在实验设计初期就完全没有考虑之后可能用到何种统计学方法,实验设计的盲目性对后期数据的选择产生较为明显的影响,从而使得实验结果出现一定程度的偏差。

总的来说,在医学实验中应用统计学方法出现的错误较为常见,而且类型繁多,本文只是总结了较为常见的几种错误。由此,医学工作者及相关实验人员应当在日常工作当中,进一步汲取统计知识,并且一定在实验初期确定实验的指导思想,从而确定采取何种统计方法收集数据、分析数据、得出结论等,进而可以获得较为理想的实验结果。同时,还应当加强与统计方面相关人才的联系,减少错误出现的可能性,这对医学工作者进一步提高自身的科研能力和科研水平是大有裨益的[4]-[5]。■

参考文献

[1]胡良平,刘惠刚. 医学论文中统计表达和描述方面的错误辨析与释疑[J]. 中西医结合学报,2007,03:352-354.

[2]刘清海,方积乾. 医学期刊统计学误用现状、趋势与对策[J]. 中国科技期刊研究,2006,04:549-552.

[3]李长平,胡良平. 医学博士学位论文中的实验设计及数据分析错误辨析[J]. 军事医学科学院院刊,2006,05:453-456.

[4]李蕾,汪东生,张莉,刘文雅,米楠,范蕊,周辰,王宁利. 医学论著写作过程中常用统计学方法的描述和常见错误[J]. 中华眼科医学杂志(电子版),2012,03:188-190.

[5]李子建,沈东舜. 医学期刊论文中常见统计学错误辨析[J]. 实用医药杂志,2013,12:1129-1131.

作者简介:

刘东方(1986.08 -):男,汉族,山东济宁人,大学本科学历,北京法马苏提克咨询有限公司,统计师,主要从事医学临床研究工作。