首页 > 范文大全 > 正文

语文选择题命制优化路径思考

开篇:润墨网以专业的文秘视角,为您筛选了一篇语文选择题命制优化路径思考范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

一、选择题作为测试工具的基本意义:引出“反应”,体现“建构”

在教育测量与评价话语系统中,选择题是一种测量与评价“工具”。在测量与评价理论体系中,工具(题目)通常是第二位的,在这之前首先有一个理念或概念一建构。“建构”指的是我们想要测量的对象。“教育测量的对象多属于人的心理属性,它是不能作为物质实态来操作的结构概念。这种结构概念,不能直接测量,只能从测量与这个结构概念有关的或从反映这种结构概念的(可测量的)因素着手,对这个结构概念进行间接的测量。”“我们假设要测量的建构有一个特定的、简单的形式:从一极到另一极,譬如从高到低,从小到大,从正面到负面……我们的主要兴趣是考察特定的‘反应’处于两极之间的哪个位置。”然而,建构的特征是“潜在的”,因此测量与评价要解决的一个关键问题是如何用外显的“工具”引发学生隐性的思维过程、认知“反应”,并据此测量其潜在的“建构”水平。工具、反应、建构之间的关系可以用下图表示:

依据上述理念,选择题作为测试工具的一种,其使命自然也是以恰当的形式引发学生适宜的反应,而这个反应应该恰好与所要测量的建构(如语文阅读能力的某个方面)相吻合。因此,测试目的、测试工具和答题实际反应之间的内在一致性是试题开发和检视的一个基本立足点。这就是为何在《语文测试选择题命制现状管窥》(发表于《语文建设》2014年第3、4期)一文中,笔者会不遗余力地从显性和隐性两个层面分析题目试图测试的能力和实际测试的能力。显性层面为:题干表述提示的测试意图和一些官方、公开解释中明示的测试意图;隐性层面为:题干、选项所引导的思维反应或学生在阅读具体题干和选项后优先选择的答题思路、行为反应。放大之后可以看到,其间可能存在的事实是:试图测试的能力和实际测试的能力之间可能有落差;试图明示的能力也存在诸多所指模糊的地方。根据测量建构理论,这些“事实”并不能就此接受,所以即使那些题目已经成了稳定的典型题目,我们还要进一步推敲和尽可能改正、优化

那么,如何尽可能保证试题的意义呢?根据上图,首先需要从调整宏观流程开始。完整的命题、测试过程应该包括如下四个步骤:解释要测量的建构;创设题目,确保能引导被试做出特定的反应以体现其相应的建构水平;实施测试;分析数据,检查结果是否与最初的意图一致,即学生的反应是否能对应于特定的建构水平或相关描述。

这四个步骤环环相扣形成一个圆周。这是一个基于对建构的理解,又完善对建构的理解的过程。理论上来说,我们在命题时应该尽可能严格遵守上述步骤,而不应该是习惯性地按照特定题型的样子出题。

对照实践,我们需要加强如下研究和实践环节:加强基础理论研究,包括语文素养、语文能力的勾勒,在此基础上进一步明确测试语境中的具体所指;试题开发前尽可能明确需要测试的能力指向,并在试题开发过程中严格执行;在一些大规模考试后的分析中纳入测试结果和建构间相互关系的研究。一方面,分析试题是否较好地测量了试图测量的建构,另一方面,可以根据测试结果来修正对建构的认识和理解。

二、选择题的一般类型和一般功能

《语文测试选择题命制现状管窥》一文,在纵览各省、历年语文高考卷的基础上,呈现了七类较为稳定的典型题目。梳理的标准主要是题干表述的相似性、稳定性。然而,这只是基于客观现实而临时采用的分类标准,不具有学理依据。我们不妨来看一下国际评价话语系统中关于选择题类型的梳理和功能的定位。

1.选择题的一般类型

选择题的类型和意义还需要放在整体题型图谱中来看。

国际学生评价项目(PIsA)的“测评框架”,在介绍其使用的题目类型时有这样一段简短的介绍:“主观题,即需要专家评分的题型,包括开放性建构反应项目和简短的建构反应项目;客观题,即不需要专家评分的试题,包括多项选择题、复杂的多项选择题和封闭的建构性反应项目。”其中主观题、客观题是我们所熟悉的概念,但这段说明中还涉及两对相对来说我们可能比较陌生的概念:建构性反应项目和选择性反应项目;多项选择题和复杂的多项选择题。

建构性反应项目和选择性反应项目,其实倒是在国外测量与评价话语体系中更常见的一对概念。顾名思义,建构性反应项目指的是学生必须独立解决问题,譬如填空题、简答题、作文题;选择性反应项目,是学生从教师提供的答案中选出正确的答案。选择性反应题目,并不仅仅指我们日常所说的选择题,还包括是非题(二元选择)、匹配题。

多项选择题和复杂的多项选择题,与我们的术语有些出入。前者,其实就是我国国内所说的单项选择题。詹姆斯・波帕姆撰写的《教师课堂教学评价指南(第5版)》中说到多项选择题时明确指出:“多项选择题都要求学生选择一个符合题干的正确答案,或者一个最佳答案。”由此推断,国外“多项选择题”概念中的“多项”指的是备选答案,即选项,而我国所说的“多项选择题”的“多项”指的是最终从备选选项中选择的正确答案可能不止一个,大致对应于“PIsA”测试框架中说的复杂的多项选择题。无论要求学生选出一个答案还是几个答案,换个角度,从答案属性来看,选择题又可以分为两类,正确答案形式和最佳答案形式。后者说的是:“其中所有选项都部分正确,但有一个明显优于其他。这种类型用于考查较为复杂的成就,比如要求学生选择某个行为的最好理由、做某事的最好方法或某个原理的最佳应用。用正确答案形式还是用最佳答案形式,取决于要考查的学习成果。”

从国际题目类型分类框架可以看出,题目分类的立足点不是题目本身的“模样”差异,而是学生的行为反应差异。

选择题不是万能的,它只需充当好题型图谱中所能承担的角色即可,存在的价值也许恰恰就在于其“限制性”。某种程度上,就是要在限定的情境中,使“书写能力的影响得以控制”,“发现学生的薄弱环节”。

2.选择题的一般功能

选择题引发学生做出选择性反应之后,归根结底是要从学生选择的答案中判断其在预期学习结果和表现方面的水平。那么,选择题可以考查哪些预期学习成果和表现呢?

对此可以做两个层面的思考:一是“一般性目标”,譬如,我们所熟悉的布卢姆教育目标分类学及其修订版所要阐明的认知目标层级和知识类型;二是学科领域具体的学习成果和表现,是“一般性目标”在学科领域的具体化,是学科领域反过来对“一艘性目标”的发展。

关于第一个层次,我们可以看到不少积极的介绍:

多项选择题在美国和其他国家已经主导了成就测验领域长达几十年,它可以用来测量学生对知识的掌握情况以及更高水平的思维能力。

它可以考查从简单到复杂的多种学习成果,也可以产生质量最高的题目。

它适合于测量从机械记忆水平到最复杂水平间各水平的教学目标,当然,综合能力除外;特别适合于项目分析,发现学生的薄弱环节。

测评最佳“best”答案的题目,允许比较高级的区分和辨析(allow for greater discrimination),能非常有效地测量理解能力。

麦克米兰还曾尝试把认知目标层级和各种题型的适用程度进行比对。他认为选择性题目不仅适用于测试知识的记忆,如果出的题目巧妙还能非常有效地测评学生的理解能力(包括深度理解)和推理能力。

上述表达给我们一些信心,答案标准化的选择题,是有其测试意义和价值的,我们努力的目标是在运用选择题时,让它恰如其分地发挥最大价值。至于其能测试怎样的能力类型和水平,需要结合上文所述的关于语文测量建构的研究结果来进行恰当的选择。

三、选择题的开发:有意识的选用和有针对性的设计

1.有意识、有针对性的选择题型

在上文提及的测量建构理念影响下,一些评价类著作,在介绍题型设计规则时会给出与上述建构理斜目呼应的提醒。例如:“决定测验中采用哪种题目类型时,―个指导性的原则是:所使用的题目类型应当对预期学习成果所指明的学生表现做出最直接的考查。有效的成就测验要求设计出一系列测验题目来引出预期学习成果所描述的表现。”

与理论的呼吁相呼应,在一些国际著名的测评项目中,可以看到在其命题开发过程中有着相关的环节控制,有意识地考虑题型和能力测试目标之间的对应性。以“PISA”测评项目为例,“测评框架”文件会有专门的篇幅阐述题型选择问题。

首先,测评框架指明,“反应形式”,即题型的选择有两个依据:一是题型必须有利于收集需要的证据(即上文所解释的,以特定的形式引出学生特定的反应,以证明其在某方面的学习结果);二是大规模测试的实用性。

在综合考虑各种情况的基础上,“PISA”测评框架给出了在各个认知层级上,主客观题型的比例分配(客观题主要指选择题和封闭的建构性反应题目),如下表:

虽然在大规模考试中客观题比例适当偏多,但这也从侧面反映出,选择题测试的能力范围是较为广泛的。如“PISA”测评项目这样,在命题之前有意识地考虑各类题型的利弊,有意识地将题型和所要测试的认知能力联系起来思考,甚至对题量做出大致规定,有利于保证具体题目的测试针对性和测试结果的解释力。

2.关注每一种能力的实质性考查

在“PISA”测评框架中,以及每次测评项目结束后公布的样题中,有一个值得注意的部分,即关于每一个测评题目属性的说明,例如:

题目1:英国研究者有什么建议?(笔者注:关于刷牙。因为篇幅原因,选项略,下同。)

情境:教育的

文本形式:连续文本

文体类型:说明

认知方面:访问和检索

题型:单项选择题

难度:358(1a级)

题目2:从总体上说,剧作家默纳在这部分节选中做了什么?

情境:个人的

文本形式:连续文本

文体类型:叙述

认知方面:整合和解释一形

成广义的理解

题型:单项选择题

难度:556(4级)

题目3:为什么有两个热气球的图形?

情境:教育的

文本形式:非连续文本

文体类型:描述

认知方面:反思和评价反

思和评价文本内容

题型:单项选择题

难度:411(2级)

对于这样的公开解释,应该可以起到两个作用:一是让我们看到每一个题目的具体指向和功能,考查的是学生阅读特定类型文本的特定的认知过程;二是当把若干个题目放在―起看的时候,我们可以注意到题目之间相对明晰的差别。正是基于各个题目的特定指向和不同题目的合力作用,才能较为立体、全面地检测出学生在阅读素养方面的整体情况和特定维度上的表现。相比之下,我们也有公开解释,但看到的是较为模糊的结果(见《语文测试选择题命制现状管窥》)。

3.虚心吸收既有命题规则

选择题具体的产生过程,需要基于对试图测试的目标的准确理解,基于对文本的准确把握。对这两个方面的充分理解需要落实到具体的题目撰写过程。《语文测试选择题命制现状管窥》一文已经显示:试图测试的目标和实际测试的能力之间可能会有差距,题干指向和选项指向之间可能不一致,造成这种局面的原因,一方面可能是对目标定位不够清晰,另一方面可能是试题编制技术不够成熟,在题目撰写过程中产生偏差。

在目前出版的测量与评价类书籍中都会有关于试题编制的专门章节,关于每一类题型都会介绍其作用、意义,并提出题目撰写中的一些规则。虽然是一般理论、原则,但对于语文学科命题研制还是有一定启发意义的。譬如,关于选择题题干、干扰项、正确项的设计,以下一些建议值得我们参考。

每道题目的设计都要考查一个重要的学习成果题目所基于的问题情境应当是重要的,并且应与所要考查的预期学习成果相关

各道题目的目的是要引出某种类型的表现,以帮助判断学生在多大程度上达到了预期学习成果。(笔者注:这是“建构原理”在题目撰写层面的体现,抓手就是题目所表述的问题情境。)

在题目的题干中呈现一个清楚定义的、单一的问题题目的题干中所提出的任务应该非常清晰,这样学生不用读选项也可以理解它

事实上,检验选择题题干的清晰性和完整性的一个好方法是,遮住选项并判断没有那些选项时是否可以回答题干中的问题。(笔者注:结合上面一条一起来反思我们既有的题目,不少题干缺乏问题情境色彩、缺乏问题解决意识,如“下列表述正确/不正确的是”等。也就说,题目要考的应该是酐所阐述的问题、任务引发的能力,而不是纯粹的比较选项的能力,所以如《语文测试选择题命制现状管窥》一文中所提及的太多考查学生比对选项信息、比对选项和文本细节信息的题目是需要引起我们注意和酌情改变的。)

干扰项应该是合理且错的如何产生好的干扰项?一个比较好的方法是先识别学生一般可能有的误解或错误,由此干扰到那些有此误解或错误理解的学生。(笔者注:反观我们的命题实践,这一步可能还要适当加强。)

使干扰项对未掌握者有迷惑性和吸引力:用学生的语言来表述选硕;在干扰项和正确答案中都用“好听的”词(准确、重要);使干扰项在长度和用词复杂度上与正确答案相似……

确保预期答案是正确的或明显最好的在用最佳答案形式时,预期答案应该是有实力的权威所公认为明显最好的、在后一种情况中,可能还有必要在题目的题干中加上“下面中”,以考虑到题目中没有包含的但同样好的答案。

只要有可能,就以肯定形式表述题目的题干,这是因为,知道诸如最好方法或最恰当论述之类的东西通常比知道最差方法或最不恰当的论述有更大的教育意义,每当题目的题干中用了否定表述时,一定要对其进行强调,在有些情况下,要测量某个重要的学习成果,很有必要使用否定表述例如,知道不应该在亮红灯时过街和不应该将某些化学品混合如此重要,以至于这些规则可能要直接教导和直接测验任何存在危险的情境都需要否定性强调几乎任何规则或程序都会对要避免的做法作一些强调。(笔者注:在语文学科中而言,似乎否定形式的题目有些泛滥。不乏―篇短文三个选择题都是否定形式表述的情况。)

通过改变题干中的问题或者改变选项来控制题目难度一般而言,最好通过使问题更复杂来提高所需的知识水平,从而提高题目难度,但是,也可以通过使选项更相似来提高难度,当这样做时,一定要小心确保所需的更为精细的区分具有教育意义,而且与所考查的学习成果相协调。(笔者注:最后一句提醒需要谨记。)

综上,命题的过程不是习惯性的延续既有经验、沿用传统题型而已,而是一个包含了从深谙宏观理念、明确中观目标、熟微观的系统工程。这三个层面都需要我们做出持续、深入的探索。