首页 > 范文大全 > 正文

Excel在非参数检验中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇Excel在非参数检验中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]非参数检验是经管类专业统计学原理课程的一项重要教学内容,目前的教学中侧重于理论讲解,而忽视实践操作。本文介绍这类检验在excel中的具体实现过程,以加深对理论的理解,实现理论与实践的结合。

[关键词]假设检验 非参数检验 Excel

近年来,非参数统计技术得到迅速发展,已成为现代推断统计的重要分支。因此,在高校经济与管理类统计学的教学中,非参数检验成为一项重要的教学内容。在讲授非参数检验时,老师们会详细讲解其理论基础与算法,但并没有介绍如何使用相关统计软件进行计算与分析。这样的教学方式存在一些明显的缺陷:首先,理论教学与实践相脱节,学生们虽然熟知算法,但动手能力不强;其次,由于没有实际动手,一些同学对理论的理解不透彻。这些都是实际教学中确实存在的问题。为此,我们完全可以在教学中增加一定的实践课时,给同学们讲解使用相关软件进行非参数检验的方法,以弥补现有教学方式的缺陷。

那么,应选用何种软件呢?虽然一些专业的统计软件(如SPSS)能够很容易地实现非参数检验,但根据笔者的经验,在实践教学中,最好选用Excel进行讲解。主要的考虑是,利用Excel中进行非参数检验的计算时,基本上是利用其公式与数学函数、统计函数等功能,逐一实现理论算法的每一步骤,能够加深学生对非参数检验的理解;而SPSS是直接给出结果,并没有中间的步骤,学生往往是知其然,不知其所以然,不能通过实践来巩固对理论的理解。此外,目前Office软件已经普及,大部分同学能够比较熟练地操作Excel,讲解时学生也比较容易接受。

针对经管类统计学教材中常见的非参数检验,本文拟以实例来介绍这些检验在Excel中的具体实现过程,而各种检验的理论背景请参见相关的统计学教材。

一、单样本符号检验

例1.设有20个工人,他们一天生产的产品件数,抽样结果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170,164,150,152,156,174,178,180,168。试以0.05的显著性水平,判定总体中位数是否是160。

解:首先提出假设:

H0∶η=160H1∶η≠160

利用Excel求解步骤如下:

1.输入数据,见图1。A、B列为原始输入数据,样本数据存放在A2:A29单元格区域,图中未完全显示出来,D、E列为计算得出的结果。

2.计算样本观察值大于中位数的个数(即正号的个数)。在E1中输入如下的公式

=COUNTIF(A2:A29,“>90”)

COUNTIF函数计算区域中满足给定条件的单元格的个数。

3.计算样本容量n(不含0差数)。在E2中输入公式

=COUNT(A2:A29)-COUNTIF(A2:A29,“=90”)

4.计算检验统计量Z。在E3中输入公式

=(E1-0.5*E2)/SQRT(0.25*E2)

5.计算临界值Zα/2

。在E4中输入公式“=ABS(NORMSINV(B2/2))”。

根据以上计算结果,由于2.75 > 1.96,检验统计量的样本值落在拒绝域,故拒绝原假设,即不能认为总体中位数是90。此外,也可通过求二项分布的临界值进行断断。

二、配对样本的符号检验

试用符号检验法检验这两位裁判裁定的成绩是否有显著性差异(显著水平0.05)。

解:提出假设:

5.计算临界值。二项分布临界值可用Excel的分布函数求得。在E7中输入公式“=CRITBINOM(F3,0.5,1-F2/2)+1”即可。其中第一个参数存放的是n;第二个参数是一次试验中成功的概率,根据二项分布临界值表的要求,固定为0.5;第三个参数是概率保证度的临界值,对于单侧检验,它等于1-α,对于双侧检验,它等于1-α/2。因为CRITBINOM返回的是使累积二项式分布概率大于等于1-α(或1-α/2)的最小值,所以根据符号检验的要求,应在上述公式中加1。

由于r=6

=9,所以不能拒绝原假设,即不能认为两位裁判的裁定成绩有显著性差异。

三、威尔科克森配对符号秩检验

该检验也是用于检验配对样本情形下,两总体分布在位置特征上是否有差异。与上一检验不同的是它考虑了配对观测之间差别的大小。首先,将配对观测值之差di

的绝对值按大小递增排列,并从1至n给以秩次。其次,对每个秩次按照di

的正负号赋以正负号。再次,分别对正号秩与负号秩计算秩和,所得之秩和不带正负号,记作∑秩(+)与∑秩(-)。为检验两总体平均水平是否有差异,可建立下列原假设H0∶∑秩(+)=∑秩(-)。两个秩中较小的一个,作为威尔科克森T统计量,将其作为检验统计量(例3略)。

四、卡方独立性检验

该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。这里的变量主要是指定类、定序资料。为了分析变量之间的关联性,需要将资料整理成列联表的形式。

例4.抽样调查某地区500名待业人员,这些人员中文化程度为高中及以上的有104人(男44人),初中的有96人(男36人),小学及以下的有300人(男140人)。问此调查结果能否说明待业人员中的文化程度与性别是相互独立的。

解:提出假设:

这些待业人员文化程度与性别是相互独立的这些待业人员文化程度与性别不是相互独立的Excel的计算过程如下。

1.构造工作表,见图3。图中的文字以及方框之内的数字为原始输入数据,其他为公式计算所得。

2.建立期望值表。

(1)计算实际数表中的行合计与列合计

在E4中输入公式“=SUM(B4:D4)”,并将该公式复制到E5:E6单元格区域。在B6中输入公式“=SUM(B4:B5)”,并将公式复制到C6:D6区域。

(2)计算期望值

在B9中输入公式“=$E4*B$6/$E$6”,然后选定B9:D10区域,按Ctrl+R组合键,再按Ctrl+D组合键,即可将公式复制到B9:D10区域中的其他单元格。

(3)期望值表中的行列合计可以参照(1)中的方法,也可以将实际数表中的行列合计公式直接复制到期望值表中。选定E4:E6区域,按Ctrl+C,再单击E9单元格,按Ctrl+V,即可计算出行合计;再选定B6:D6区域,按Ctrl+C,再单击B11单元格,按Ctrl+V,即可计算出列合计。

3.建立卡方统计表,并计算卡方统计量。

在B14中输入公式“=(B4-B9)^2/B9”,并将公式复制到B14:D15区域的其他单元格。最后计算行列合计。此时,卡方统计表右下角的E16单元格中的数值即是所要求的卡方统计量。当然在卡方统计表中,卡方统计量可以直接用公式“=SUM(B14:D15)”求得,这样就不一定要计算行列合计了。

4.计算临界值。显著性水平为0.05,自由度为2,在B18中输入公式“=CHIINV(0.05,2)”即可得到临界值。

根据以上结果,卡方统计量为2.633小于,小于自由度为2的卡方临界值5.991,所以我们不能拒绝原假设,也就是待业人员中的文化程度与性别之间没有显著的关联性。

参考文献:

[1]曾五一,肖红叶.统计学导论[M].北京:科学出版社,2006.

[2]曾五一.统计学[M].北京:金融出版社,2006.

[3]黄良文.统计学(修订第三版)[M].成都:四川人民出版社,2006.

[4]曾五一.统计学概论[M].北京:首都经济贸易大学出版社,2003.

[5]茆诗松.概率论与数理统计教程[M].北京:高等教育出版社,2006.

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文