首页 > 范文大全 > 正文

汉语高级精读测试信度分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇汉语高级精读测试信度分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:本文以留学生期末测试试卷和测试成绩为分析对象,采用SPSS软件对试卷进行分析,主要包括试卷结构、正态分布、信度、难度、相关性等,重点分析了试卷的结构、信度、相关度,目的是为了评估该试卷的质量及可靠性,也为反馈教学效果和科学编制试题提供依据。

关键词:试卷分析 信度 相关性

一、引言

语言测试与评估是对外汉语教学的四大环节之一,对教学起着非常重要的作用。对学生来说,通过测试成绩能够客观地评价自身的学习进展和成果,认识到自己有哪些方面的不足,然后调整学习。对于教师来说,成绩测试结果在一定程度上反映了教学效果,可以了解到学生在成绩测试中哪些是普遍薄弱的环节,哪些是全班均掌握的知识技能。为了使语言测试更加科学合理,需要对试卷进行全面综合的分析。

二、试卷分析

本文以上海交通大学留学生2015年6月高级汉语期末考试精读试卷为研究对象,被试为35人,试卷共有67道题目。借助SPSS统计软件,对试卷的结构、试卷内容、测试成绩及试卷质量分析如下:

(一)试卷结构

表1:试卷结构

题型 选词填空 选择 填写关联词 排序 完成句子 选词改句 改换句式 阅读理解 总数

题数 12 8 6 2 8 16 8 7 67

分数 15 8 6 8 16 16 8 23 100

本次考试的题目量为67,其中客观题36题,包括选词填空、选择、填空、排序、选词改句中的填写成语部分,共计37分;主观题31题,包括完成句子、选词改句、改换句式、阅读等,共计63分。主客观题比例分布处于一个比较合理的比重范围。

(二)试卷内容

表2:试卷内容

题型 题数 知识 理解 运用 总分

(道) 分值 分值 分值 比值

拼音 词汇 语法

选词填空 12 15 10%

选择 8 8 8%

填写关联词 6 6 6%

排序 2 8 45%

完成句子 8 16 10%

选词改句 16 8 8 8%

改换句式 8 8 20%

阅读理解 7 23 100

百分比 45% 23% 32% 100%

从表1、表2可以看出,本试卷总体设计比较合理,知识类试题占45%,理解类占23%,运用类占32%,从知识、理解和运用类题目比重来看,该试卷比较注重考查学生的理解运用能力,试卷的设计基本符合高级汉语大纲要求。

三、测试成绩分析

(一)测试成绩的基本描述指标

考试成绩的基本描述指标选择算术平均数、中位数、标准差、偏度系数、峰度系数、最小值和最大值等统计量。见表3和图1。

表3:试卷成绩的统计描述部分指标

描述统计量

N 全距 极小值 极大值 均值

统计量 统计量 统计量 统计量 统计量 标准误

选词填空 35 12 3 15 11.40 .541

选择 35 7 1 8 6.71 .215

填空 35 3 3 6 5.09 .185

排序 35 7 1 8 5.97 .324

完成句子 35 10 6 16 11.97 .475

选词改句 35 16 0 16 13.31 .658

改换句式 35 6 2 8 5.29 .264

阅读 35 20 3 23 15.29 .995

总分 35 48 48 96 75.97 2.191

有效的N(列表状态) 35

我们把35名学生的听力总分进行了Q-Q图检验。检验结果如下图,从图中可以看出,各点近似围绕着直线,说明数据呈近似正态分布。

图1:试卷成绩频数分布

总分的正态Q-Q图

标准观测值

转换:自然对数差别(1)

(二)试卷的难度

适合本次统计分析的难度系数的计算公式为P=X/W,其中X为平均得分,W为满分值。难度系数越大说明试题越容易;难度系数越小说明试题困难程度越高。对于期末考试,一般难度范围应控制在0.3~0.8之间。在统计出各大题平均分后我们可以计算出各个题型和试卷整体的难度系数,如表4所示。

表4:试卷各大题和整体的难度

总分 选词填空 选择 填写关联词 排序 完成句子 选词改句 改换句式 阅读理解

均值 75.97 11.40 6.71 5.09 5.97 11.97 13.31 5.29 15.29

难度 0.7597 0.760 0.838 0.848 0.746 0.748 0.831 0.661 0.664

从表中可以看出,选择、填写关联词和选词改句在0.8以上,属于较容易的题型,其他题型基本符合难度范围0.3~0.8之间,属于正常难度的题型。上图没有低于0.3的题型,说明缺少难题。总成绩的难度是0.7597,在正常的难度范围内,但是数值偏高,说明总体来说题目偏容易。因此,试卷需要适当的增加题目的整体难度,增加难题的数量,让题目的难易分布更加合理。

(三)试卷各题型的相关性分析

本文对试卷的各个题型进行相关分析后发现,总分与各题型的相关系数最高,均呈正相关且接近1。其他题型之间的相关系数较为复杂,有正相关、负相关,也有趋近于0的不相关。选词填空、选择题、填空题都与阅读有较高的相关性;排序题与所有题型的相关性都不高;完成句子与改换句式有较高的相关性。题目的相关性研究对试卷的编排有着重要的意义,应该努力提高题型之间的相关性,让试卷内容整体上的联系更加紧密。

表5:各题型之间的相关性

相关性

总分 选词填空 选择 填空 排序 完成句子 选词改句 改换句式 阅读理解

总分 Pearson 相关性 1 .737** .468** .342* .327 .570** .508** .523** .790**

显著性(双侧) .000 .005 .044 .055 .000 .002 .001 .000

N 35 35 35 35 35 35 35 35 35

选词填空 Pearson 相关性 .737** 1 .346* .208 .304 .354* .233 .253 .479**

显著性(双侧) .000 .042 .230 .076 .037 .179 .143 .004

选择 Pearson 相关性 .468** .346* 1 .271 .213 .170 -.136 .323 .439**

显著性(双侧) .005 .042 .115 .218 .329 .437 .059 .008

填空 Pearson 相关性 .342* .208 .271 1 .029 -.037 .131 -.015 .393*

显著性(双侧) .044 .230 .115 .868 .831 .451 .933 .020

排序 Pearson 相关性 .327 .304 .213 .029 1 .125 -.121 .258 .149

显著性(双侧) .055 .076 .218 .868 .473 .489 .135 .392

完成句子 Pearson 相关性 .570** .354* .170 -.037 .125 1 .345* .483** .231

显著性(双侧) .000 .037 .329 .831 .473 .043 .003 .181

选词改句 Pearson 相关性 .508** .233 -.136 .131 -.121 .345* 1 .255 .137

显著性(双侧) .002 .179 .437 .451 .489 .043 .139 .432

改换句式 Pearson 相关性 .523** .253 .323 -.015 .258 .483** .255 1 .253

显著性(双侧) .001 .143 .059 .933 .135 .003 .139 .143

阅读 Pearson 相关性 .790** .479** .439** .393* .149 .231 .137 .253 1

显著性(双侧) .000 .004 .008 .020 .392 .181 .432 .143

**. 在 .01 水平(双侧)上显著相关。

*. 在 0.05 水平(双侧)上显著相关。

(四)信度分析

本次测试主要采用Cronbach的α信度系数法,表6为本次测试的信度系数,其结果显示α信度系数为0.718,基于标准化项的α信度系数为0.784,两项数值均大于0.60,说明本次测试内部信度较高,测试各部分反映了同一种能力。

表6:α信度系数

可靠性统计量

Cronbach's Alpha 基于标准化项的 Cronbachs Alpha 项数

.718 .784 9

四、结语

本次测试以汉语高级班期末考试成绩为对象,从统计数据中可以看出:试卷内容结构符合高级阶段高级汉语的教学目标重点;试卷难度虽然偏低,但从另一方面说明学生对知识和技能的掌握较好;试卷和题型相关性较好,内部信度较高,反映出所测能力的一致性。但学生的排序题分数较低,反映出语段表达能力有待提高。

参考文献:

[1]杨端和.语言研究应用SPSS软件实例大全[M].北京:中国社会科学出版社,2004.

[2]王萍,宋春阳.留学生汉语听力试卷内在信度相关因素分析[J].现代语文(语言研究版),2010,(7).

[3]刘润清,韩宝成.语言测试和它的方法(修订版)[M].北京:外语教学与研究出版社,2002.

[4]秦晓晴.外语教学研究中的定量数据分析[M].武汉:华中科技大学出版社,2004.

[5]陆晓红.对外汉语成绩测试试题设计研究[D].上海:华东师范大学硕士学位论文,2008.

(沈规利 宋春阳 上海交通大学人文学院汉语国际教育中心 200030)