开篇:润墨网以专业的文秘视角,为您筛选了一篇对我国大学生思辨倾向量具信度的研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
摘要:本文报告了对我国大学生思辨倾向量具的信度研究结果。该量具经过两次检验。第一次测试涉及12所高校、2770名学生;第二次测试涉及51所高校、18825名学生。研究结果表明,修订后量具达到统计要求,有广泛的适用性。
关键词:思辨能力;思辨倾向;思辨倾向量表
中图分类号:H319.3 文献标识码:A 文章编号:1001―5795(2011)06―0019―0005
在国际人才竞争极其激烈的背景下,国内外教育专家一致认为培养学生的思辨能力。是高等教育的重要任务之一。外语类大学生思辨能力的培养已引起众多学者关注。要培养学生的思辨能力,首先应有明确、具体的目标,还需要有测量学生思辨能力现状与发展情况的量具。这是研究并实施培养大学生思辨能力目标的基础性工作。我国在这方面的工作起步比较晚。2008年笔者获得国家社科基金资助,开始研制测量我国大学生思辨技能与思辨倾向的两个量具,用以比较外语专业与其他专业的学生在思辨能力和思辨倾向上的差异。2008年我们用这两个量具对全国12所高校2770名学生进行了测量。2009年,我们对两个量具做了修订,并在全国51所高校18825名学生中进行了测试。据我们所知,这是我国目前最大规模的大学生思辨能力调查。本文将报告2008年与2009年思辨倾向量具信度检验的过程与结果。
1、文献回顾
1.1国外对思辨倾向量表的研制
“Critical thinking disposition"这个概念首次由美国“德尔斐”项目组(Delphi Project)提出,本文将其翻译成“思辨倾向”,它是人们有关思辨活动的习惯性、一致性的内部动机(Facione,et a1.,2000:6)。思辨倾向与思辨技能(critical thinking skills)构成思辨(criticalthinking)的两个不同向度,是培养思辨能力不可或缺的两个方面(Giancario&Facione,2001:3)。
思辨倾向量表(Califomia Critical Thinking Disposi―tion Inventory,下面简称为CCTDI)由Facione等人于1995年创建,其研制过程从质性认定到量化测试,经过多次修订。问卷题的设计理据源于美国“德尔斐”项目组提出的有关思辨者的人格倾向特征。该项目组由多名跨学科专家组成。他们首先就优秀思辨者的特征取得共识。基于这些共同特征写出250个描述句子,做到正向与反向句数量尽量平衡,再邀请大学思辨能力教育专家对这些句子进行筛选,留下表面效度最高的150个句子用于试测(Facione,et al,2001:4)。这是一个从“非常同意”到“非常不同意”的六级量表。受试者根据所给的句子,在6个等级中挑出一个符合自己看法的选项。经过试测,得到内部一致性指标与区分度指数,最后从150个句子中筛选出75个。因子分析的结果表明75道题内含有7个因素,经分析、重新归类,最终确定为7个维度:好奇心、开放性、系统性、分析性、寻真性、自信度、成熟度。
该量表各维度的题目数在9―12之间。7个维度的信度指标Alpha为0.71~0.80,整体信度是0.91;在1019名大学新生中进行重测,7个维度的信度指标在0.60~0.78之间,整体信度是0.90。研制者称,其信度与效度经过多个样本检验,结果稳定。
笔者认为美国“德尔斐”项目组对思辨倾向概念的定义及其对理想中思辨者人格特征的界定是一项开创性工作,CCTDI的研制具原创性,但目前提供的信度指标仅仅基于少数学校中部分学生的数据,不足以证明它适合于整个目标群体。
1.2国内对思辨倾向量表的翻译与修订
我国对思辨倾向的研究基本上是对CCTDI进行翻译、修订与运用。罗清旭(2002)首次将思辨量表翻译成中文并对我国大学生进行测量。他试测了173名大专与本科大学生。信度指标不理想,7个维度的Al―pha值在0.39―0.65之间,整份量表的Alpha值只有0.64。他认为量表信度偏低的原因是少数题目翻译不准确,还有少数题目不符合中国国情。经修订,在382个大学生中进行重测,信度指标有了明显提高,7个维度的Cronbachα值在0.46~0.83之间,整个CCTDI的Cronbachα值提高到0.86。罗还在87人中测试了思辨倾向与人格五因素的关系,其结果表明,3个维度与人格五因素中的“经验开放性”呈显著正相关。
彭美慈等人(2004)批判CCTDI的中文翻译只注意语义等值,不考虑文化情景因素。因此他们根据概念等值的理念,从中国文化语境出发,修订了CCTDI中译本(修订后的量表下面简称CCTDI-CV)。他们首先通过焦点小组交谈,了解学生对译文的理解。在此基础上将原来75个项目增加到80个。再经过3位专家对80个题目的内容一一审定后,进行试测。根据试测结果删除了10道题后,再次测试。最终量表包含70道题,分为7个维度,每个维度10道题,其中有16道题增加了情景化描述,有利于中国学生对其意义的理解。由于前期工作细致、认真,程序科学,因此整体量表的Alpha值达到了0.90。
总之,目前国内只有罗清旭与彭美慈等人对CCT―DI进行了修订与信度检验。他们的态度是科学、严谨的,尤其是彭等所做的工作特别值得提倡。其中不足的是,罗测量的样本只限于一所综合性大学;彭等测量的样本虽来自6所学校、人数达到1829人,但学生都来自护理专业,同质性太高。就目前已有的信效度研究结果,我们还不能断定CCTDI-CV是否能够适用于中国整个大学生群体。
为了弥补思辨倾向量表信度检测样本太小、受试人员不够多样化的不足,本次研究选择了涵盖多学科、多专业、多年级的大样本来改编适合中国大学生群体的思辨倾向量表,同时对量表内部结构(construct)进行了深入分析。我们一共举行了两次大规模测试。第一次于2008年年底完成,主要目的是了解CCTDI是否适合测量我国大学生群体的思辨倾向。第二次于2009年年底完成,重点在于改编CCDTI,使之符合中国文化情境。下面我们分别报告这两次研究的过程与结果。
2、 2008年测试
2.1研究设计
2.1.1受试
2677名被测学生来自全国12所高校,分布在全国9个省市自治区,其中有915名学生来自3所"985”学校;422名学生来自3所"211”学校;1340名来自其他普通院校(见表1)。受试中男生865名,女生1907名,男生占总数的32.4%。受试来自三个不同年级,81个班级。1年级学生有988名,2年级有865名,3年级有823名(见表1)。该样本属于方便样本,由课题组成员联系相关高校教师,最后各校自愿决定参加。
2.1.2量具的修订
本次量具的修订主要侧重检查75道题的英文原
文与中文译文的一致性。本课题组5人均为高校英语教师,5人分头独立工作,然后共同讨论5人检查出的问题。对英文原文理解有分歧时,就请教英语本族语者。最后集体润饰每道题的文字,尽量做到不留翻译痕迹,语体一致,语句顺畅,又不太过口语化。
2.1.3测试的组织与实施
除了课题组的4名成员,我们邀请了70名教师协助组织测试。测试前,我们向这些老师详细解释了测试要求、流程与应注意的问题,同时还印发了书面测试指导语,为的是在12个学校81个班级中能够统一测试要求。测试于2008年11月至12月间举行。测试分班级或年级进行,时间为20分钟。
2.1.4数据分析
数据分析分两个阶段。第一阶段是数据处理。首先,将每个学生的选项逐个输入电脑,然后统计每题原始频次,纠正输入错误。其次,检查缺省值的情况。删除未答题达到20%以上者,本次删除93名学生。然后,转换40道反向题的数值。第二阶段为信度检验。我们用SPSS软件的Scale Reliability程序检验7个维度以及整个量表的内部一致性。首先测量了75道题的信度指标,删除了与整个量表呈现负相关的7道题目,又在计算7个维度的Alpha值时删除了与单维度呈负相关的5道题,最后剩下63道题。我们又分别计算了外语类与文科类学生的各项信度指标,探究学科类别是否对其有影响。
2.2研究结果与讨论
表2列出了本次研究所得到的整体及7个维度的信度指标。整体样本的信度指标为0.84,似乎还能接受,具体到7个维度的信度指标,除“开放性”以外,虽然没有美国样本高,但都在可接受范围。唯有“开放性”的Alpha值仅有0.29,不符合统计要求。下面深入分析其原因。
我们认为可能的原因有两个,其中最重要的原因是部分问卷题带有明显的文化特征,致使中国大学生对问卷题的理解与美国学生不同。例如量表中的第24题“判断是非题时,思想开放有自己的局限性。”是一道反向题,有积极思辨倾向的人应该不赞成这一看法。然而中国学生长期受到的教育是,对待是非问题不应该模棱两可,摇摆不定,更不能宽容、大度,不分是非。可以预测我国大部分学生都会赞成这种看法。果然,数据表明,偏向同意一端的学生高达86.7%。同样第36题也是一道反向题“外国人应该学习我们的文化,而不该总要我们努力去理解他们的文化*”,拥有积极思辨倾向的人应该不赞成这样的看法。对于美国大学生来说,他们应该学习外国文化,而不应总是要求别人学习美国文化。而我国所处的发展阶段与美国不同。改革开放30年来,我们一直在认真学习外国的先进文化与科学技术,现在到了一个新时期,希望外国人也了解中国文化。因此在这个问题上有67.2%的学生偏向同意的一端。再如第45题“我不该被迫去为自己的观点做辩护。”,研制者认为拥有积极思辨倾向的人应该反对这个观点,因为别人有权要你对自己的观点进行解释。在中国文化中,别人发表不同意见,你可以不听,但你不会强迫别人一定要给出理由。因此中国学生中有74.8%都偏向同意的一端。
根据表2,就外语类与文科类两类大学生而言,信度指标的差别在0.01~0.05之间。这似乎表明,这个量表对两类学生均适用。遗憾的是,本次测试没有包括理工科学生,因此我们还不能推断量表适用于理工科学生。
3、2009年测试
3.1研究设计
3.1.1受试
参加本次问卷调查的学生合计18953名,来自全国51所高校,分布在全国19个省、市、自治区。最终进入数据分析的学生共有18825名,未进人数据分析的有128名学生,原因是他们的阅读卡无法被机器识别。该样本也是方便样本。
据表3,51所高校中,985学校9所,21l学校8所,其余34所为普通高校。男生占总人数的34.06%。
18825名学生分别来自外语类和非外语类的文科(以下简称“文科”)与理工科的l、2、3年级,同一所高校的三类学生高考的入学成绩基本相似。外语类学生中男生1369人,女生6036人,男生占总数的18.5%;一本生为4434人,占总人数的59%;二本生为2677人,占总人数的36.2%,三本学生390人。文科类学生中男生1604人,女生3741人,男生占总数的30%;一本生2460人,占总数的45.5%;二本生2538人,占总数的46.9%,三本生409人。理工科类学生中男生3353人,女生2468人,男生占总数的57.6%;一本生3119人,占总数的52.82%,二本生2348人,占总数的39.76%,三本生445人。外语类学生主要来自英语专业,其中655名学生来自其他专业,德语138名,罗马利亚语23名,日语471名、匈牙利语23名。文科类学生来自38个专业,理工科学生来自48个专业。
3.1.2对量表的进一步修订
我们对量表的修订工作分两步进行。首先进一步确定思辨倾向的维度,然后修订问卷题。我们的量表包括8个维度,其中7个与CCTDI完全相同,第八个正义性(justiee-oriented)是新增维度,用于测量人们对不公正、触及法律、违反道德等事件的态度。我们相信这是大学生需要具备的重要思辨倾向之一。如果一个人缺乏正义感,离开了道德观念的约束,高超的思辨技能很可能导致犯罪手段更隐蔽,狡辩方法更恶劣,给社会造成更大的危害。
然后我们将CCTDI原有的75道题逐题审读修订,凡是与中国文化不吻合的题目全部删除;凡是翻译不当或者意义不清的都进行修订。对正义性维度,我们新设计了6道题。本着删繁就简的原则,整个量表的题目压缩到54题(见附录),每个维度包含6―8道题不等。课题组5人分别反复对54道题的分类进行检查,从不同角度对题目提出质疑,然后经过讨论,取得共识。
3.1.3数据收集与分析
由于本次调查涉及的人数多,学校分布范围广,收集数据的时间前后达两个月。负责组织测试的教师有218名。一般情况下,按班级实施测试,特殊情况也可按年级组织。完成答卷的时间为15分钟。
与2008年测试不同的是,本次测试的学生答题卡由机器逐个阅读。全部数据的读入由两台机器同时工作,耗时近一个月。其后对数据的处理与分析程序与2008年相同。最终符合统计要求进入8个维度的问卷题有50道,4道题被删除,题号是02,06,07,15。我们对8个维度进行了归类,构建了思辨倾向四层次框图(见图1)。
底层的8个维度可归为四个类别,智力(intellectu。alness)、情感力(emotionality)、理智力(rationality)与道德力(morality);然后再将智力与情感力归为学术性(academic dimension),理智力与道德力归为社会性(social dimension)。学术性主要与课程学习相关,社会性主要与人际活动相关。智力与课程学习的知识层
面相关,情感力与课程学习的情感层面相关;理智力与人际交往中的理性程度相关,道德力指与人际交往中的社会行为规范相关。将思辨倾向8个维度归为不同层次,便于我们厘清它们之间的内在关系,也有助于我们识别大学生思辨倾向中存在的问题,为其提供有针对性的训练与教育。
3.2研究结果与讨论
表4列出了不同层次思辨倾向所含问卷题的题数、Alpha值,以及每个维度所包含的题号。整份量表的Alpha值为0.87;学术性与社会性的Alpha值分别是0.84与0.80;智力与情感力的Alpha值分别是0.74与0.79;理智力与道德力Alpha值分别是0.70与0.64。最低层次的8个维度的Alpha值在0.50~0.73之间。总体上看,该量表的信度指标达到统计要求。
表5列出了4项不同研究的信度指标。首先比较2009年与2008年的结果。学术性方面的四个维度比较稳定,变化不是非常大;社会性方面的几个维度中,开放性有了显著提高,其他两个的变化也不大。从趋势上看,2009年的研究与彭等的研究非常相似,学术性方面的思辨倾向信度指标高于社会性方面。而美国样本未出现这样的特征。我们认为这一差异值得进一步研究。
最后我们要考察信度指标是否受学科的影响。表6列出了2009年的测试结果。从底层的8个维度看,文科学生的“成熟度”信度指标(0.62)明显高于外语类(0.55)与理工科(0.57)学生,而其他7个维度的差异性都在0.1~0.2之间。在上一个层次的4个维度上,Alpha值的差异都很小,均在0.1~0.2之间。这表明量表的信度指标基本没有受到学科的显著影响,能够适用于整个大学生群体。
4、结语
本次测试样本大,学生来自不同地区、不同学校及不同专业,差异性远远大于现有文献中的任何一项研究。量表的总体及单个维度的信度指标都符合统计要求,可以用于我国大学生思辨倾向的测量,但社会性方面的四个维度信度偏低的原因值得进一步研究,量表中被删除的4道题需要再次修订。此外,我们准备用2009年数据进一步研究中国大学生思辨倾向现状,同时比较外语类、文科类、理工科类三类学生在思辨倾向上的差异。
基金项目:国家社科项目资助(08BYY026)和北京外国语大学“211”工程(三期)建设经费资助。