开篇:润墨网以专业的文秘视角,为您筛选了一篇结构方程模型在英语阅读语料库中的研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
【摘要】该文从建立基础型英语阅读语料库(English Reading Corpus, ERC),然后采用结构方程模型(Structural Equation Modeling, SEM)及语言统计学方法,从英语阅读语料库的语篇复杂度、学习者个体的信息获取水平及情感因素三方面进行了建模及相关关系的探索性研究,在数据统计和分析的基础上,找到了满足置信度及可拟合的数学模型,以期能对英语阅读教学和学习有所启示。在通过对SEM的ERC建模之后的数据进行全面、准确的统计分析,能够为提高英语阅读教学质量提供有价值的统计数据和分析资料。
【关键词】结构方程模型;语料库;英语阅读;数值拟合
【中图分类号】G420 【文献标识码】B 【论文编号】1009―8097(2010)05―0106―04
引言
探索影响英语阅读能力的各种因素及其关系是英语阅读教学的一个重要环节,结合语料库与结构方程模型的英语阅读分析方法为研究这一问题提供了可能。
近几年来,语料库的相关研究[1,2]已经得到了快速发展,并成为语言学实证研究[3,4]的一个重要手段。文中,语料库将作为测试和验证的基础辅助材料,采用结构方程模型充分利用建好的语料库建模与验证是核心。
结构方程模型(Structural Equation Models,SEM),其主要的目的是验证潜在变量与观测变量之间的关系。概念涉及因素分析、路径分析、典型相关、判别分析、多元方差分析以及多元回归分析等。Bock等[5]于1966年最早提出了验证性因素分析这一理论,后经演变[6],使之成为一个更通用的模型,即协方差结构方程模型,结构方程模型可同时分析一组具有相互关系的方程式,这种可同时处理多组变量之间的关系的能力,有助于研究者开展探索性分析和验证性分析[7]。
一 英语阅读研究概述
通过对英语类文章的信息加工形成可塑的阅读模式,其本身包括了对词汇、语句、段落和篇章的合理理解。英语阅读以阅读能力的培养和提高为重点,根据阅读对象的变化及时调整自己的阅读方法。阅读方法的调整并非易事,需要合理的理论方法结合实践来验证,SEM能够为解决这一问题带来方便。
针对于英语阅读的教学特点和目前学习者参与考核的现状,本文以SEM与基础型语料库为依据建立有效的英语阅读训练方法,采用结构方程模型,对英语阅读理解认知、个体遇到的阻碍因素进行统计研究,以期能为英语阅读理解提供更为全面的有效方法和科学依据。
二 研究方法
1 英语阅读语料收集
本文将1999年至2008年非英语专业四、六级英语阅读文本资料分类整理,共收集阅读材料160篇,从而构建一个基础型英语阅读语料库。
2 英语阅读语料库研究方法
本文采用Wordsmith Tools 5.0作为检索工具,主要借助该检索工具分析语料库语篇文本的总体信息,如文本的形符数、长词数、句子长度、被动语态、从句结构等,并间接获取语料文本的复杂度信息和难易程度估计。
现以2005年6月大学英语六级试题第二篇阅读理解为例来进行基本的统计分析,利用Wordsmith Tools工具的WordList分析该语篇的基本信息如表1所示。
根据表1数据计算出该语篇的复杂度系数及难易程度估计系数,对于所有语料进行同类操作之后将其数据编入基础型英语阅读语料库复杂及难易程度表中,以便于在后续SEM中观测变量中使用。
3 研究变量分析
本文首先围绕学习者信息获取水平、语料库中语篇复杂度和学习者情感因素三个方面展开。由于学习者的英语阅读水平实际上是无法直接观测的,只有通过适当的可观测变量加以反映,才能将代表学习者真实的阅读水平体现出来,这里采用表2所示的可观测变量来反映其内涵。
表2中信息获取水平依赖的观测变量这样划分是有一定依据的,不过更为详细和完善的划分还需要更多更好的实验作支撑,加拿大学者F. Smith[8]指出:“阅读的技巧实际上在于尽量少用眼睛,当我们成为熟练的读者时(接触过),我们就学会了较多地依靠已有的知识(背景知识程度)、依靠我们的头脑(智力程度)而较少地依赖于文字符号”。
在上表2中设计的三组潜变量后对应的观测变量均需要通过相应的测试或工具度量而进行量化,所有的观测变量均采用十分制统计。测试成绩是测试对象随机从语料库中抽出语篇答完题之后的真实成绩,语篇不重复抽取。
4 结构方程模型的语料库研究
结构方程模型由测量模型和结构模型两部分组成,测量模型主要用于表示观测变量与潜变量之间的关系,而结构方程模型主要用于表示潜变量之间的关系。其相应的统计分析软件主要有SPSS结合AMOS、LISREL,本文采用AMOS 18.0进行数值统计和验证分析。结合本文的研究,从以下四个方面阐述SEM的建模过程。
(1)模型设定
结构方程模型由测量模型和结构模型两部分构成:对于显变量与潜变量间的关系,即测量模型部分;对于潜在变量之间的关系,即结构模型部分。根据已有的研究成果设定模型的内部变量结构关系,并通过抽取的数据对模型所有路径系数的总体参数进行估计。为了便于绘制模型的结构图,本文采用AMOS Graphics进行建模(如图1),AMOS Graphics提供了完全图形化的操作界面,用户友好且易于操作,在结构模型路径图中,观测变量在AMOS Graphics结构模型路径图中用正方形或长方形来表示,潜在变量用圆形或椭圆形表示;对别的变量产生影响的变量称作外生变量,而受到别的变量影响的变量称作内生变量;用单箭头直线表示假设一个变量对另一个变量产生影响,而用双箭头曲线表示假设两个变量之间未必有因果关系的相关。模型建好之后,通过抽样数据对模型所有路径系数的总体参数进行估计。
(2)模型估计
通过上面设定的模型,现在可以根据观测变量的方差协方差对模型中的参数进行估计。在结构方程模型的参数估计过程中,常使用极大似然估计法(Maximum Likelihood, ML)进行参数的估计。其实,观测变量的方差协方差矩阵是一套参数的函数,在结构方程中,包含了固定参数及自由参数,通过ML估计使得方差协方差矩阵中每一个元素都尽可能地接近样本观测变量的方差协方差矩阵中相应的元素。
(3)模型检验
模型检验是检验结构模型在多大程度上拟合了数据,也即模型拟合优度的检验,并为后续模型参数的修正提供依据。在建立各种统计模型或数学模型时,常会遇到模型拟合优度不高的问题,这个时候也不必为迎合统计数值结果改掉模型,而是要考虑整个系统的理论框架是否在实践中有效,在实践检验中适用就可以了。
检验模型拟合度指标有拟合优度指数(Goodness-of-fit index,GFI)、调整的拟合优度指数(Adjusted-goodness-of-fit index,AGFI)、比较拟合指数(Comparative fit index,CFI)等形式,模型拟合度检验本身是一个相对复杂的问题,一般认为GFI、AGFI、CFI的值在0~1之间,其值越趋近于1,表明整体模型拟合度越好。在AMOS Graphics结构模型中,常采用卡方(Chi-square)值、拟合指数(Fit indices)、标准残差值(Standardized residuals,RMSEA)等对结构模型的拟合情况进行判断。AMOS Graphics通过计算估计工具可以对模型参数估计进行计算,当计算完成后,再通过查阅报表可以查阅参数估计结果。
(4)模型修正
如果拟合指数没有达到可接受的水平或者需要对某种理论进行修正,我们就要对已有的结构模型进行修正,对其中变量之间的关系重新设定。AMOS本身提供了输出修正指数(Modification indices)的功能,我们可以通过修正指数来判断需要修正模型中的哪些变量关系。通过AMOS工具栏中View的Analysis Properties按钮,在对话窗口中选择Output标签,并勾选Modification indices,AMOS的输出结果将包含修正指数内容。
三 应用结果分析
实际应用测试过程分为三步,首先了解样本数据的描述性统计量,为了直观反映各个内生观测变量的分布情况,先计算其描述性统计量,在SPSS软件中直接通过分析项中的描述统计工具获取统计信息,并利用分析项中的可靠性分析度量计算克朗巴哈α系数(如表3所示)。从表3可知,其值均大于0.7,表明观测变量的三类研究的信度可以接受。
其次,通过上述在AMOS Graphic结构方程模型中建好的模型,在导入数据后可以进一步对模型参数进行估算,然后进行模型检验。单击工具栏中的“Calculate estimates”按钮,AMOS即开始模型参数估计计算。计算完成后,单击“View text”按钮,查看模型检验结果。根据AMOS报告的该研究各项拟合指数,发现该模型数据拟合并不理想(见表4)。
这里参照AMOS提供的模型修正指数对模型进行修正,修正指数报表见表5。
根据表5,一共有四组误差之间修正指数值显著高于其他修正指数,分别是(e10e11)、(e5e5)、(e2e12)和(e9e10),这表明它们之间具有显著相关关系,因此可以利用双箭头曲线将这四组误差连接来修正模型,修正后的结果如图2所示,其中图2(a)为非标准化结果,而图2(b)为标准化结果。
最后,再次验证对修正后的模型,实验结果表明,该模型中各指标在潜变量上有很好的负载,路径系数均达到显著水平,修正后的模型拟合指数达到了可以接受的水平(如表6所示)。这一显著拟合的模型表明将英语阅读能力的影响因素按照该模型表示是合理的,并进一步阐明了其内在的实质和存在的关系。其中,CMIN/DF表示差异与自由度的比值,IFI表示增量适合度指标,TLI表示Tucker-Lewis指标,CFI表示比较适合度指标,RMSEA表示平均平方误差平方根。
Byrne[9]在1994年提出了一种SEM拟合指数的标准,表7为其中的部分拟合指数的标准参数。
事实上,SEM拟合指数的基本要求只是个经验性的参考值,并非硬性指标,没有哪个指标是最重要的,要想确定模型与数据是否拟合,主要看绝大多数拟合指数是否接近或者达到基本标准。从表6结合表7的数据中可以看出,CMIN/DF 为1.166,CFI、RMSEA均满足指标,模型拟合度令人满意。因此,可以认为该模型能较好地解释语篇复杂度、学习者获取信息水平和学习者情感因素三者之间的关系。
图2(b)的分析结果显示,信息获取水平的因素负荷量依次为0.93、0.87、0.60、0.90、0.82、0.72,其表达了各自的相对影响力。语篇复杂度的新概念多少的标准回归系数是0.22,标准回归系数表示预测变量改变一个单位因变量的改变单位量。图2(b)标准化结果的回归系数是一个无量纲数值,其绝对值小于1,大于零为正相关,小于零为负相关,绝对值越接近1相关性越好,越接近零相关性越差,绝对值小于等于0.4为弱相关,0.4到0.8之间为中等相关,大于0.8为强相关,这里的结果反映情感因素与学习者信息获取水平呈强相关,而语篇复杂度与学习者信息获取水平呈弱负相关,语篇复杂度与情感因素也呈弱负相关。
四 结束语
本文将语料库分析与结构方程模型的基本理论结合起来应用于英语阅读可能存在的问题进行实质性探索,以其期得出其所受影响的因素及其存在的关系。首先从语料库入手,整理并按类按难易程度等因素入库,并将其作为学习者获取信息水平的一项重要指标;然后建立结构方程模型,找出基本能概括影响英语阅读水平的三项潜在变量及其相对应的观测变量;最后验证所建立的结构方程模型合理。
总之,将语料库与结构方程模型应用于英语阅读这一领域尚属初步探索,其它易于影响该模型的因素还需进一步研究,不管怎样,有了SEM和ERC的前期研究,一定会得到更多研究者的注意,同时推动该研究领域的发展。
参考文献
[1] Hanna Skorczynska Sznajder. A corpus-based evaluation of metaphors in a business English textbook English for Specific Purposes[J].2010,29(1):30-42.
[2] Greg Kessler. Virtual business: An Enron email corpus study.[J].Journal of Pragmatics.2010, 42(1):262-270.
[3] Anna Trebits. The most frequent phrasal verbs in English language EU documents A corpus-based analysis and its implications. System[J].2009, 37(3):470-481.
[4] 刘晓玲,刘鑫鑫.基于语料库的大学生书面语词块结构类型和语用功能研究[J].中国外语, 2009, 6(2):48-53.
[5] Bock, R.& Bargmann,R.Analysis of covariance structures. [J].Psychometrika.1966, 31(4):507-534.
[6] Nian-Sheng Tang, Xing Chen, Ying-Zi Fu. Bayesian analysis of non-linear structural equation models with non-ignorable missing outcomes from reproductive dispersion models. Journal of Multivariate Analysis[J]. 2009, 100(9):2031-2043.
[7] 文秋芳.“作文内容”的构念效度研究―运用结构方程软件AMOS 5的尝试[J].外语研究, 2007, (3):66-71.
[8] Smith.F. Understanding Reading―A Psycholinguistic Analysis of Reading and Learning to Read. Second Edition, Holt, Rinehartand Winston.1978, 82:9.
[9] Barbara M. Byrne, Structural Equation Modeling with EQS and EQS-Windows: Basic Concepts, Applications, and Programming, Sage Publications, Inc., Thousand Oaks, CA, [D].1994.