首页 > 范文大全 > 正文

基于项目反应理论调试性英语测试a值调整

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于项目反应理论调试性英语测试a值调整范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:区分度a值是衡量考试题目质量最重要的参数。在电脑调试性英语测试中,造成题库建设难度过大的主要原因在于题目区分度a值的界定线异常模糊,题目区分度a值很难被确定。传统的人工界定法极其耗时,甚至不能完成。利用极大似然法,建立区分度a值精确的数学模型,编写计算机程序解该a值模型,完成对a值快速而准确的调整

关键词:区分度;a值; 英语测试; 题库

中图分类号:TN911-34 文献标识码:A

文章编号:1004-373X(2011)20-0111-03

Adjustment of a Value for Debugging English Test Based on Item Response Theory

FENG Kai-ping1, LIANG Xian2

(1. Dept. of Information Technique, Sichuan Higher Institute Cuisine, Chengdu 610072, China;

2. College of Foreign Languages, Hainan University, Haikou 570228, China)

Abstract: The distinction degree a value is the most important parameter that assesses the quality of examination questions. In computer English adaptive test, it's difficult to construct a database. The main reason is that the definition of a value line is abnormally fuzzy ,and the a value is difficult to be sure. The traditional artificially definition method is very time-consuming, Can't even finish. An accurate mathematical model for the distinction degree a value was established with the maximum likelihood method. A calculator procedure was compiled to solve the model of a value. The quick and accurate adjustment for a value was implemented.

Keywords: degree of distinction; adjustment; a value

决定测试题质量最重要的参数是题目的区分度a值。一般情况下,包括经典测试在内的所有考试形式都应当较精确地确定题目的区分度值。在经典英语测试中,每位考生做同样的考题,题目质量对于确定考生的能力特质作用不明显,一般不重视a值优劣。但是在调试性英语测试中,a值在极大程度上决定了考生的特质水平,因此对于题目a的确定就显得格外重要。通常情况下,确定a值的办法是通过专家对该考题的长期观察与测试实践而最终确定的,人为主观性较强,而且由于对题库中上千道测试题确定a值的工作量巨大,致使这种先进的测试形式得不到普及。本文通过建立a值的数学模型,编写计算机程序,自动调整a值。

1 调试性测试理论基础

项目反应函数用来描述项目反应模型特性,如下式[1]:

ИP(θ)=c+1-c1+e-1.7a(θ-b)(1)И

项目反应函数描述的是考生的答对概率P(θ)与项目的质量参数a,b,c及考生特质水平θ在数值上的关系,如图1所示\。

图1 罗杰斯蒂模型

在调试性英语测试系统中,区分度a用于精确界定题目是否能够真实反映考生的能力,区分度越高,题目质量越高。理想情况下,图1中难度值b值点的曲线斜率a应当是垂直的,但实际中却是按(式(1)变化的1条曲线。

a表示b点处曲线的倾斜度,它反映了试题的区分特性。分为5个级别,即0.5,1,2,5,10。每次考试结束后,对每个选择了该考题的考生根据能力值θ调整a值。从题目有效性来讲,当a值低于0.5时,表明区分度较低,此考题将被淘汰。图2显示了c=0时不同a 值下的罗杰斯蒂曲线。

2 信息量函数

题目的信息量越大,越能反映被测者的能力或特质水平,信息函数则是描述一个测验或一道试题信息量的工具。对第i道题,其信息函数可用下式表示[2]:

当考试结束后,由考试管理员运行一次上述代码段进行a值调整。

5 结 语

a值的大小决定了题库的质量,决定英语自适应测试的成效。在初期测试阶段,其a值的确定主要靠专家主观观察而确定,精度不能保证,因此,必须在每次考试时或考试后对a值不断进行调整,使得a值逐渐趋于真实。调整的方案可以是即时调整法,即考生每做一道题立刻进行调整。这样做势必增加服务器的负担,降低程序运行速度,考生调题时会感觉到明显的延迟,延长了考生的等待时间和考试时间。基于上述调整法的不足,尝试着采用统一调整法,即考试结束后进行a值的统一调整,它既减轻了服务器的负担,同时也使得所有考生使用同一个a值进行考试,保证了考试的公平性。

在实际应用中观察到,在主频为3.2 GHz的服务器上运行该程序,600人参加的考试,一次调整时间为32 s左右。

参考文献

[1]DUNKEL P A. Considerations in developing or using second/foreign language proficiency computer-adaptive tests \. Language Learning & Technology, 1999, 2: 78-80.

[2]习盛丰,何志国.基于Web的自适应考试系统的研究与设计[J].计算技术与自动化,2008(3):125-127.

[3]李天博.基于Web方式的网络试题库管理系统[J].计算机工程,2000(z1):662-664.

[4]成汝震,刘宏忠,于化龙.基于Web自适应考试系统[J].计算机应用,2002(7):122-124.

[5]郝文化与网络数据库开发[M].北京:机械工业出版社,2004.

[6]杨昱,王红艳.基于题库自适应在线考试系统的分析与设计[J].武汉理工大学学报,2008(4):158-159.

[7]袁健.基于Web的自适应上报系统技术的研究与实现[J].计算机工程与设计,2007,28(19):4810-4812.

[8]曹新社.基于项目反应理论的计算机自适应考试系统[J].福建电脑,2006(3):142-143.

[9]付聪.计算机自适应测试研究进展[J].现代情报,2005(1):61-64.

[10]程艳.计算机自适应考试的理论模型研究[J].计算机与现代化,2006(9):24-27.

作者简介: 冯凯平 男,1959年出生,副教授。研究方向为数据库、程序设计、教学研究。

梁鲜女,1958年出生,副教授。研究方向为英语、语言学、教学研究。