首页 > 范文大全 > 正文

探究R统计软件在一类两样本均值检验中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇探究R统计软件在一类两样本均值检验中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要 两样本均值检验是比较常见的工程问题,涉及的领域包括生物学、医学、工程检测等。两样本均值检验是统计学的重要组成部分,传统手工计算方式效率较低,且难以保证准确性,统计学软件的应用可以有效提高两样本均值检验的计算准确性,目前主流的统计学软件包括R统计软件、SPSS、SAS、Splus等,统计学软件的工程应用已经成为工程统计领域的发展趋势。本文将深入地研究R统计软件在两样本均值检验中的应用,并结合实例分析程序模型的可行性。

【关键词】统计学 R统计软件 两样本均值 检测 应用

很多工程实践中存在两样本均值检验的问题,传统的两样本均值检验采用手工方式,导致数据处理效率较低,同时难以保证数据处理的准确率。统计学软件的应用可以有效提供两样本均值检验的效率,常用的统计软件包括SPSS、Splus、Excel、SAS等,其中R统计软件是目前使用最为广泛的,下面将结合实例分析R统计软件在两样本均值检验中的应用。

1 R统计软件简介

R统计软件是基于R语音开发的一款统计学软件,R语言实际上属于S语言的分支。20世纪80年代,S语言是美国贝尔实验室开发出的一款用于统计分析的解释型语言,可以实现数值统计、样本分析、统计图像、编写函数、建立统计模型等,较早的机遇S语言的统计软件包括Splus。R语言是在S语言基础上改进的,与S语言具有较好的兼容性,同时根据R语言编写了数据处理与制图软件,R统计软件的主要功能包括数据处理、数据存储、数组运算等,同时可以进行连贯统计分析,支持编程语言设计。

R统计软件涉及多个领域,包括社会学、经济学、生态学、统计学、医学等,软件包括了25000个程序包,除此之外,R统计软件支持多种运行环境,支持Windows、MacOS、基于Linux的系统等,R统计软件属于命令行驱动模式,输入命令后即可得到相应的结果,R统计软件的主要优势包括资源丰富、扩展性好、人机交互性好、使用成本低等。R统计软件的主要缺陷在于用户要求高、占用内存大、运行速度慢。

2 R统计软件模拟T分布

假设两组样本X1 ,…,Xn~N(μ1 ,σ)和Y1 ,…,Ym~N(μ2 ,σ)相互独立,则两样本均值检验的内容是H0 :μ1=μ2 ,H1 :μ1≠μ2。这种情况的检测情况可以分为两组,一是σ与σ已知,可以构建U检验统计模型

,式中的与是两组样本的平均值,当条件成立时,U~N(0,1),所以针对给定的显著性水平α,如果U ≥Z/2,则拒绝原假设条件 。二是σ与σ未知,建立T检验统计模型

,,式中的与是两种样本的方差,当假设条件成立时,T~t(n+m-2),如果T ≥t/2,则拒绝原假设条件。实际问题中经常出来一组方差已知,而另一组未知的情况,可以构造统计数学模型

针对一组方差,另一组方差未知的情况,可以构建

,利用R统计软件实现上述模拟分布计算。

3 样本分析

下面根据两个案例进行分析,一个是某地区的两组儿童视力检测数据的样本均值检验情况,另一个案例是克山病患者与健康人的血磷值得样本均值检验情况。

案例一:抽样调查某地区的十名儿童,对所有样本进行实例检测,可以得出所有儿童的左右眼视力检测结果。具体结果如表1所示。

由X样本的数据可以计算出X的方差为σ=0.104,且左右眼的均值一样,则有代码:

sigm=0.104; Times=10000;

DTstar(sigm, Times)

根据上述的代码可以得到T统计模型的分布密度图,具体的图形分布如图1所示,根据图像可以看出T属于零值对称分布。

案例二:随机从某克山病区抽样十一名克山病患者与十三名健康人,检测患者与健康人之间的血磷值(mmol/L),可以统计得到如下结果,见表2。

通过数据比较两组数据的差异情况,数据的置信水平为α=0.05,可以假设健康人数据方差为σ=1.7,具体的R代码如下:

alpa=0.05

TTest(xigm,alpa)

利用R统计软件完成上述数据,运行程序后可以得到结果为“Reject null hypothesis”,可以看出拒绝假设,因此可以得知克山病患者与健康人之间的血磷水平具有显著差异,利用R统计软件可以极大地提高检测效率与准确性。

4 总结

两样本均值检验是比较复杂的统计学问题,而且是比较实际的工程问题,已经涉及多个工程领域,包括生物学、医学、质量检测等领域,比如分析实验鼠的体重差异比较问题,药品对患者的影响问题。统计学软件将是统计学未来的发展趋势,R统计软件具有强大的统计分析能力,同时具有图形展示平台,提高了数据统计分析的效率,但我国基于R统计软件的应用研究较少,很多研究难以用于实际项目,本文从R统计软件的功能以及在两样本检验中的应用进行研究,分析了R统计软件的应用实例,希望本文的研究有利于我国R统计研究的发展。

参考文献

[1]薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2006.

[2]赵培信.多元正态分布均值向量检验的R软件实现[J].电脑知识与技术,2012,8(31):7501-7503.

[3]程新,魏赛金,江莉.统计软件R及其在《生物统计学》实验教学中的应用[J].统计教育,2008,4(103):29-31.

作者单位

1.浙江工业大学理学院 浙江省杭州市 310023

2.浙江理工大学经济管理学院 浙江省杭州市 310000