首页 > 范文大全 > 正文

网络环境下写作文本中的叙事结构及其计算

开篇:润墨网以专业的文秘视角,为您筛选了一篇网络环境下写作文本中的叙事结构及其计算范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘 要] 语言具有社会性,学习语言的目的是为了运用。从写作文本的观察和比较中找出叙事结构并进行计算是当前网络环境下技术促进语言运用研究的重要方向。在三种国际上流行的文本分析途径的基础上,本文建构了“SEHL”叙事结构的分析模型,并采用句子编码的方式实现了对写作文本叙事结构的计算。在一个长达两年的技术促进语言运用的追踪研究案例中,这种叙事分析模型和计算方法初步显现出了效果,发现了学习者写作文本结构发展的相关规律。叙事结构及其计算在写作文本分析中具有非常重要的实践意义,为语言材料中提取出学习者的叙事结构提供了一种可计算的途径,为认识网络环境下不同学习者写作结构如何发展的问题,提供了一种有益的尝试研究和解释。

[关键词] 叙事结构; 写作文本; 作文分析; 技术促进语言运用; 语言计算

[中图分类号] G434 [文献标志码] A

[作者简介] 赵兴龙(1982—),男,甘肃张掖人。助理研究员,博士,主要从事教育技术基本理论与实践研究。E-mail:。

一、研究问题的提出

语言运用是指学习者在习用语言的过程中不断操作和使用语言文字进行社会真实体悟并交流和表达的过程。[1]在网络环境下技术支持的写作中,学习者可以运用语言文字,可以运用思维逻辑,他们可以运用叙事结构吗?这听起来似乎都是很难联想到一起的事情!其实,叙事结构的运用不但可以巧妙地为布局谋篇服务,而且表情达意,使文章情节生动富有感染力。学习者对写作文本中叙事结构的运用拥有一种空间上的分布特征,这种分布特征最大的特点就是可替代性,也就是说结构保持一致,但内容可以遵循一定的规律进行替换。在某种文体的文本中,总是存在着某种格式骨架,这种骨架是保持不变的,变化的是支持这些骨架的内容,可替代性在这种“不变”与“变”的辩证关系中体现出了文本空间结构的分布特征。那么这种分布特征的分析途径如何构建,如何进行计算就是本文重点关注的问题。

二、三种叙事结构分析途径的比较

文本中叙事结构的分析主要有三种不同的途径:第一种途径从情节入手,主要代表人物为Mandler等;第二种途径从高潮入手,主要代表人物为Labov等;第三种途径从依赖关系入手,主要代表人物为Deese等。

(一)从情节入手——故事语法(Story Grammars)

故事语法一般遵循“问题解决”的基本线索。先是主人公处于某种环境,发生的一些事情或行为引起某种反应或制定某种目标,主人公尝试某种解决办法(在尝试过程中可能成功,也可能失败)或试图达到目标,最后获得某种结构并诱发主人公的某种行为。这样的线索串接起来就形成了一种“环境—初始事件—内部应对—解决办法—结果或后果—反应”情节单元,如图1所示。每一个情节中包含的句子有多有少,说明情节的复杂程度是高低不一的。有时候初始事件可能就一个,而解决的办法有若干个,办法与办法之间还可能存在着嵌套关系;有时候初始事件和解决办法可能就一个,但内部应对表现出了主人公复杂的内部思考和思想矛盾,会用非常多的句子来表示。概括起来,用故事语法进行叙事结构分析主要有如下特征:(1)大多数的故事语法遵循“问题解决”模式,但未必仅此一种模式;(2)故事语法中的情节连接点一般包括“所处环境\初始事件\内部应对\解决办法\结果\反应”这六个,每个节点描述的复杂程度与句子的数量并不是一一对应的;(3)故事语法单元的完整性决定了叙事文本的质量。

从早期的研究中可以看出,故事语法的主要功能是让研究者了解学习者是怎样使用故事结构图式去理解叙事,同时也关注学习者的故事结构图式是如何发展的。[2]故事语法是一种故事内化了的表征,有了故事语法就可以更好地去理解和回忆故事。如果偏离了这种普遍性的规则结构,故事的理解就会放慢,记忆就会发生错误。[3][4]就像一些学者在文章提到的一样,故事语法给教育者们研究学习者如何理解简单故事提供了一个新的视角。[5]

尽管如此,一些学者还是对故事语法提出了有力的挑战:故事语法对于产生故事而言是不成功的,它们只能产生一些程序性质的非故事内容引导读者如何完成任务。[6]这个观点对于故事语法来说是“致命一击”。如果是这样的话,故事语法便不能对一个故事的“好”与“不好”起到分辨作用,其实也就意味着故事语法的存在是没有意义的。这样的质疑引起了一批学者的反驳。[7][8][9]Rumelhart认为一种语法(就是指故事语法)真正的意图是组成结构的系统化配置,很多故事可能是基于组织图式而不是问题解决图式,真正的问题在于是否有足够多包含问题解决序列的故事形成一个有用的集合进行分析。[10]他认为这种包含足够多问题序列的故事是存在的,要找到这类故事是不容易的,而这并不表明这种组成结构是不正确的。Rumelhart的分析是完全有道理的。由于情境、规则的差异性和复杂性,故事语法很多时候并不可能都是以问题解决图式为中心的。问题解决图式一般都有明确的目标、子目标以及完成这些目标所采取的解决方案或子方案。有时候故事语法并没有呈现出明确的问题解决特征,而是以一种一般的线索组织特征来对情节进行叙述。基于不同的图式可能有不同的故事语法分析的方式,但这的确不能表明故事语法本身的信度就要受到怀疑。故事语法在本质上是各种各样的图式,这些图式的目的是为了将故事结构形式化,[11]Black等人观点的误解之处关键在于混淆了故事语法分析中所处的图式语境。

除此之外,Black等人从形式语言学的角度对故事语法进行解释,从而得出“形式不足”(Formally Inadequate),这个结论其实是站在了“形式语言学”的立场上批判了“心理语言学”的观点,这一点在Rumelhart的反驳中也被鲜明地指了出来。形式语言学中的“语法”是把句子表现出来的一种递归的手段,而心理语言学中的“语法”是一种语言单位的组成结构的分析。Rumelhart认为“形式不足”是因为过分注重了“形式”而对“心理”层面没有考虑,[12]其实这里是Black等人对故事语法概念的又一次“误解”。将故事形式化肯定是从句子出发,这无可厚非。但如何对这些句子进行形式化并不是由句子的形式来决定的,而是由句子本身所表示的意义来决定的,这是故事语法与其他语法相区别时暗含的另一个特征。支持句子意义的立场是“心理立场”,也就是说,从心理立场出发对一个语言单元的组成结构进行分析能够将故事语法中所嵌套的意义显现出来,而这种“显现”就正如Rumelhart自己所说,是“通常情况下的”而非“无一例外的”。

对于情节分析的研究,还出现了对垒的两大阵营。这两大阵营辩论的焦点集中在“文化共通还是文化特异”上。Mandler等人的研究是让利比亚没有上过学的学习者、不识字的成年人、没上过学且识字的成年人和上过学且识字的成人等四组被试进行故事回忆,然后拿相似条件下的美国人作比较。[13]研究发现所有组被试回忆的故事具有高度相似的图式。在此基础上,他们认为图式组织具有文化共通性,即不同文化背景下的被试在故事回忆上呈现出相似的图式结构。而Kintsch & Greene则坚持文化特异性的观点。[14]他们的实验依据是美国大学生在回忆Grimm Fairy Tale要比 American Indian Story好得多。在这个实验中,American Indian story的情节比较松散,而Grimm Fairy Tale的结果相对比较紧凑。Mandler等人认为Kintsch & Greene之所以得出文化特异的结论是与他们在实验中所用故事的情节结构的松散程度相关。人们往往很少回忆起松散情节的故事,是因为他们更加易于忘记整个故事的情节。[15]Pollard-Gott等人的研究则证明即使在同一文化中,故事语法可能也存在着个体差异。[16]

(二)从关键点入手——高潮分析(High Point Analysis)

高潮分析的关键之处在于围绕事件的重点建立一个或几个关键点,这些关键点有时候也被称为“悬疑点”。高潮分析的基本过程与小说有着非常大的相似之处,大都是在一种背景中提供时间、地点、人物和事件,在事件的重要之处设置一个或几个高潮,然后在这种高潮处施加某种行为,最后出现危机的解决方案。将这样的分析要素串接起来,也形成了高潮分析的情节单元“开头—定位—复杂行为—评价—问题解决—结尾”,[17][18][19]如图2所示。在这个情节单元中,高潮主要体现在复杂行为和问题解决上。引起高潮的行为越复杂,问题解决的难度就越高。高潮分析不依赖于句子或句群,而是跟引起复杂行为的“悬疑点”直接相关。概括起来,从高潮入手分析故事的主要特征如下:(1)高潮分析不依赖于句子或句群,主要针对事件重要之处的“复杂悬疑”;(2) 高潮分析中的情节单元一般包括“开头\定位\复杂行为\评价\问题解决\结尾”这六个,关键的节点为复杂行为和问题解决;(3)悬疑点的复杂程度决定了叙事文本的质量。

(三)从关系入手——依赖分析(Dependency Anal

ysis)

依赖分析的关键是建立了一种话语分析的层次结构,这种层次结构既作为话语连贯性的一种标志,也是话语分析的深度或复杂度的一种体现。如图3所示,这种分析方法是同时按照意义和句法关系来对话语进行分析,[20]先是找出中心句子,然后再找出这个中心句的从属关系句或下一级从属关系,使用层次结构来表示句子与句子或成分与成分之间的关系。这种复杂关系主要有两种:上下之间是从属关系,句式层次水平属于不同的等级(Level);并列就是平行关系,句式层次水平就属于相同的等级。能够拆分出来的Level级数表明话语层次的复杂程度,这种分析方法所得出的纲目类似某一话语的句法树,只不过这种句法中的每个“分支”是根据意义来决定的,而不是根据词或短语来决定的。概括起来,依赖分析的主要特征为:(1)依赖分析主要是针对话语中组成成分之间的从属或依附关系来展开;(2)这种关系的依赖程度可以由所分割出来的层次来表示,层次越多,说明复杂程度越高;(3)依赖关系的复杂程度决定了文本的质量。

三、叙事结构的分析模型

上述三种分析途径各有利弊。故事语法的长处是能够从心理语言学的角度对语段的结构进行分析,但是对于某一语段中某个故事语法单元的复杂程度的描述,单凭故事语法是解决不了的。高潮分析抓住了文本中最引人注意的情节单元以及情节单元之间的关系,但是仅此而已,对话语进行分析似乎有点过分注重某个悬疑点而忽略了故事的整体组织逻辑。依赖分析通过增值和精细化的处理方式从功能句法的角度抓住了语段某个部分处理的深度或复杂性,但是缺乏对语段整体结构的把握。这三者各有利弊,怎么样才能找到一种最优化的计算模型来对学习者的写作文本进行分析呢?McCabe & Peterson认为这三者是不可能组合到一起来分析的,原因是这三种分析方法有不同的分析单元和评价标准。[21]他们用这样非常经典的话语来阐释这种不可能:“一个故事在关注怎样评论主人公这个目标的时候,是不能同时注意到描述主人公衬衫的两个平行依属的形容词的”,意思其实就是说明组合使用的不可接受性。实际上,他们将这三种分析方法全部放到了一个“全文本”环境中进行评判,即用三种分析方法同时分析某一个故事的全部内容,这当然是不能兼顾的,就像目标和衬衫的修饰不能同时兼得一样。但是,如果变通使用这三种方法,不把重点都放在全部文本的分析上,而是放在“高潮”分析上,这样不仅看到了主人公的目标,而且同时看到最能突显主人公目标的那种修饰风格,岂不是两全其美的事情!

接下来讨论的非常重要的事情就是怎么样确定高潮。对于一般文本而言,高潮部分总是聚焦在问题解决的复杂程度上,比如小说就是这样。一个叙事性的作文文本的高潮部分是不是也一定聚焦在问题解决的复杂程度上呢?未必如此!因为叙事作文文本兼有叙述故事和成文两者的共有特征,叙述重在结构,但是作文叙述虽然会把经过写得非常详细,较为精彩的还不是经过,而是在当时现场写作中激发出来的、能够淋漓尽致表达作者生成性情感的内心活动,这种内心活动的出现才是整个写作的灵魂,也是作文的高潮。但是,人物内心活动情感的迸发具有随机性和不确定性,正所谓情动而辞发,情感到位了,语言中自然而然就会流露出心声,这就使得内心活动的流露在整个文本中随时都可能出现,而并非简单地出现在问题解决阶段之前。那么怎么样去确定这样一个随机出现的内心活动的状态呢?

实际上,对于一个作者而言,内心的情感活动是随机的,表现在语言文字层面也是随机的。然而,将这些随机的言语表达映射到文本结构层面的时候,就可以认为这些言语表达的出现具有某种分布的特征,这种分布的特征不但让文本的结构变得更加具有非线性的特征,而且试图让读者逐渐去了解作者或主人公内心深处的某种想法,使文本变得富有深度和意义。

这里不得不对语言学中分布的概念进行一下解释。很多语言学家将分布这一概念的内涵界定在某一语言单位的某种变量的总和这个层面上,[22][23]分布分析的用途就在于按照这种呈现关系进行分类,比如语音分类、词结等。白硕在谈到分布分析的时候认为,分布概念的实质就是某些语言学对象在特定含义下的可替换性。[24]同时,他也认为有了可替换性,这些语法功能一致的语言学对象才能聚集成类,才有可能总结出能概括普遍语言现象的规则。[25]虽然说白硕的研究主要集中在词法和句法知识方面,但是分布分析可替换性的提出对作文文本结构的分析是有启发意义的。学习者在掌握了一种短语规则后,就能根据不同的语言情景进行替换使用,从而完成相类似的一大批短语的学习,逐模加工的痕迹非常明显。从分布分析的角度来看,这种学习往往也属于同分布关系,即具有同一的语义结构模式。写作其实也是如此。尽管不同个体在言语表达和情感抒发上各有不同,但是文本形成过程中的结构形式依然有一定的规则可循,甚至可以理解为学习者随着写作知识的逐渐增加和用词用句熟练程度的增加,总是会形成某种较为固定的、大众化的文本结构呈现给读者。而表达内心活动的言语也总是伴着文本结构的逐渐稳定形成相对较为固定的分布特征并分散到文本中。具体到作文文本所指的分布其实就是指情节单元的“内部应对”(IR)这样一个结构单位在整个文本中出现的总和,也就是这个单位在文本中不同位置出现的总和,我们将其称为“IR分布度”。IR分布度的出现不是独立的,而是和其他的情节单元保持着密切的关系。

实际上,这里借用了分布分析的隐喻来说明在作文这种和作者真情实感表现紧密联系的文本中,将固定的结构作为一种“不动点”,将作者内心活动的言语表达作为一种可替换成分而形成的结构上的关系依然可以反映叙事的高潮。但是这里并没有使用替换的手法来检测情节单元进入某种语境或不能进入某种语境的差异,而将这种分布状况的总和表现出来就已经达到目的了。

鉴于学习者作文文本话语的独特特征,本研究综合了上述三种分析方法的利弊,取每种分析途径英文的首字母,形成了“SEHL”叙事结构分析模型,因为这个模型是在故事语法分析的基础上修改而来,所以又可称为“改进型”的故事语法分析模型(Advanced Story Grammars Model)。这个模型中,情节单元分析执行了全文本分析的功能,也为高潮分析提供了一种上下文背景。高潮分析仅执行了最能反映叙事主题的那个或那几个情节的分析功能,而非全部的情节,这也为依赖关系分析提供了上下文背景。而依赖关系分析也仅执行了高潮分析所捕捉到“话语”的结构关系特征。这样就很好地把这三种分析方法在不同的语境中协调起来了,而此时的依赖关系分析就已经转化成为“自由背景”条件下依据语法结构对句子序列复杂程度的判断分析了,“SEHL”叙事结构分析模型如图4所示。

“SEHL”分析模型在改进时保留了故事语法分析的基本框架,剔除了故事语法分析框架中的“反映”成分,整合了高潮模型中的“评价”成分,并且将“评价”的顺序放在了“结果”的后面。这样调整的目的是为了让“SEHL”分析模型更加通用,而不仅仅是限制在“故事”的分析中。同时,这六个情节单元没有特别固定的顺序,比如说“内部应对”这个环节就可能在“尝试解决”和“结果”之间,也可能在“结果”和“评价”之间。因为我们知道,对于写作而言,有时候是虚幻的故事,但是有时候也可能与现实生活有关的“故事”,是一种生活的经验或经历,没有想象或夸张的成分,所以对“故事语法”的改进是为了让这种分析方法能够适合更大范围的写作文本分析,实际上也就是形成了一种“叙事结构语法”格式。

对于依赖模型的整合也并没有应用到全部的情节成分中,而是依据高潮分析的思路,将叙事结构中最为关键的部分进行层次结构的分析,这样就既保证了叙事情节的完整性,又照顾到了文本在叙述过程中的重点部分,形成了一种综合的、横纵交叉的叙事结构分析模型。这里所讲的叙述结构中最为关键的部分就是指“内部应对”(IR),由此引出IR分布度的计算,也是判断文本质量优劣的重要标志。

总之,叙事结构依然要将故事结构形式化,遵循学习者写作中的“心理立场”。然而这种结构分析并没有仅仅停留在“形式化”这个层面,而是在“形式化”之后补增了叙述文本的高潮之处,并且将这种反映学习者语言运用能力的高潮话语进行复杂度分析,从而更加系统和真实地反映学习者叙事结构的发展变化过程,更加贴近学习者内在差异发展的现实特征。

四、叙事结构的计算方法

叙事结构的计算方法是多种多样的,必须找到能够反映学习者内在差异的叙事结构需要变量的支持。Ukrainetz等学者采用了两个变量来反映学习者话语能力的发展状况:[26]第一个变量是“存在”(Presence),也就是说这些叙事结构或附属结构在叙事文本中的“有”或“无”,是一个二元值;第二个变量是“频率”,至少包含一个事件的T-unit的次数,是一个连续的值。用这种双重的视角来抓住“仅出现一次”的变量和“出现多次”的变量是必需的。[27]Ukrainetz等学者的考虑是非常有道理的。但是怎样才能让某一文本的结构清晰地显现出来呢?本研究从扎根理论中的话语分析方法中找到了启示。

(一)扎根理论分析方法的启示

扎根理论的分析方法有多种多样,比如初始编码、聚焦编码、轴心编码以及理论编码等。在初始编码中,又有逐词编码、逐行编码、逐个事件编码等方式。对本研究有借鉴意义的是初始编码。初始编码的基本要求是对资料所表明的内容保持开放,贴近数据,使代码简短、生动和具有分析性,[28]而词、句子、事件就是编码的基本单元。逐词编码关注意向和意义,逐行编码关注丰富的细节,而事件编码是在比较中进行逐行编码。[29]逐行编码的基本方法就是对所记录的每行数据进行命名,这种命名的过程也就是一种形成类属的过程。这种初始编码中的类属会起到一种引导“发现”核心或聚焦核心问题的作用。

扎根理论分析方法对本研究的启示在于,一段话语是可以从句子组织关系入手进行分析,这对于写作文本分析是有意义的借鉴。对于写作文本分析而言,能够表达相对完整意义的单位就是句子,句子和句子之间的关系可以通过概括化的“类属”进行归类,然后再针对重要的“类属”进行复杂性分析。值得注意的是,这里的“类属”的意义完全不是扎根理论分析中所讲的“类属”,而是文本的叙事结构,也就是本研究构建的“SEHL”分析模型。从这种思路出发,本研究以作文文本的句子为基本分析单位,建构了“初始编码形成叙事情节”和“IR分布度”为主的叙事结构计算方法。具体切分方法请见如下这个名为“秋游”的作文文本(这里的[S]标识符指上述“SEHL”分析模型中的“所处环境”,表明这个句子是描述事件所处环境的,其他标识符的所指也是类似的)。

[S]前一段时间,我们全班同学去东莞水衔山乐民世界秋游。

[S]我在去那里的大巴车上整整睡了一个小时,等我听到同学们的嬉笑声,我才醒过来。

[S]等全部同学都下车了,导游就叫口令排队。

[S]我们排好队了,导游就带我们进入东莞水衔山乐民世界的大门。

[S]同学们看见各种各样的游乐设施,兴奋地说:什么时候可以去玩我最喜欢的游乐设施呀?

[IR]我都快要急死了。

[IE]当导游告诉我们想玩什么就玩什么的时候,同学们就兴高采烈地冲向鬼屋,去看鬼了,而我却因为害怕,独自去玩空中飞车了。

[IE]我玩完空中飞车,就去鬼屋找同学和导游,结果我只看见了正在哭泣的【谢雨恒】,其他同学都不见了,我也担心了起来。

[Att]于是,我拉着他的手一起往门口走,去找老师和同学。

[Att]当我们走到淘气堡的时候,终于看到了我的同学和导游,我们又惊讶又高兴。

[Att]接着,我们就排队跟着同学进@淘气堡@去玩了。

[Con]秋游回来以后,我把这件事情告诉了妈妈。

[Con]妈妈夸我说:你做得很好,但是下次集体活动时最好不要单独行动,有任何事情要先告诉老师或导游。

[Con]即使找不到老师和同学时,也不要慌张,而是要冷静地想办法。

[E]我觉得妈妈说的话很有道理,我一定要从这件事件中吸取教训。

(二)初始编码形成叙事情节

第一步:以句子为基本单位将这段文本切割成为若干句子。

在这种把文本切割为句子的过程中,需要参考句法和意义两个方面的标准。从句法而言,“句号”是一个句子结束的主要标志,只要找到句号,就可以将句子切分出来。其他标点符号如“叹号”也能表示一个完整句子的结束。但是特殊的句子也是存在的,尤其是在学习者还没有成为熟练的写作者之前,句子起始不明确这种情况经常存在,所以需要从意义的角度辅助判断句子的完整表达。上例中句子的切分用“[]”来表示,共有15个句子。

第二步:按照叙事结构将这些句子合并到情节单元中。

在前面的“SEHL”分析模型中已经提到,所处环境、初始事件、内部应对、尝试解决、结果和评价是叙事文本分析的六个基本的情节单元。句子合并就是需要将上述的15个句子合并到这六个基本单元中。之所以采用先切割后合并的方式并不是多此一举,而是这样的分析方法会从句法和意义的双重角度去考虑合并的类属,不至于凭借判断者的印象随意归类或归类过粗。文本中采用“[S]”表示所处环境,有5个句子支持;“[IE]”表示初始事件,有2个句子支持;“[IR]”表示内部应对,有1个句子支持;“[Att]”表示尝试解决,有3个句子支持;“[Con]”表示结果,有3个句子支持;“[E]”表示评价,有1个句子支持。

这里需要注意的是,[IE]有时候会因为写作文本内容的增添变为[S]。有的时候[IE]、[Att]、[Con]是出现在同一句话中。如“星期一我上体育课,我跟同学们玩了老鹰捉小鸡和丢手绢游戏,大家玩得很开心。”再比如“有一天我忘记带橡皮,她就把自己的橡皮借给我,她真好。”在碰到这类写作文本的时候,全部按照[Con]来处理。

在情节单元计算的时候,需要注意单个结构成分和结构成分集合的区别与联系。一般而言,单个结构成分使用一句话来表示,比如有时候[Con]是用一句话来完成的;而结构成分集合使用几句话或一组对话来完成,比如一个同学写了语文课堂中找橡皮的事情,在结尾的时候他写道:

之后到后面的同学桌子底下找,找了很久,可还是没找到橡皮擦,最后我在前面同学桌子底下找到了。

潘洋说:“谢谢你!”

我说:“不用谢,我们是同学,应该互相帮助的。”

上面这三句话整体组合起来形成了故事的结果[Con],其中作者和潘洋同学的对话是作为结果的一个组成部分出现在文章结尾的。

(三)IR分布度计算

基于“SHEL”计算模型中的分布分析的概念,人的内部应对活动是随着事件的进展随机嵌入到作文文本当中的,所以要把这些随机事件的心理活动提取出来。这种分布的计算方法如下。

第一步:IR分布度。无论在新手还是在熟练写作者的文本中,IR的出现位置都是随机的,也就是说我们始终无法寻找到一种IR出现的固定位置。但是由IR所构成的情节波折程度是可以进行计算。这里所说的情节波折程度也就是以句子为单位的分布点在叙事结构上出现的不同场景和位置的变化总和。基数为0度,每出现一次波折就按照递增1度来计算。在上述的例子中,作者的心情表达为“我都快要急死了”,而后面没有再继续出现表达作者心情的句子,所以这篇文章的IR分布度就为1度。在实际的计算中可以看出,学习者在写作的初期大致都是一个事件中出现一次IR,所以一般而言IR的度数也就是IR出现的次数。

第二步:IR句子层次复杂度:利用Stanford Parser[30]句法工具分析每一个IR所对应的句子的复杂程度,复杂程度从出现句子切分的层级开始计算。如图5所示的这个句子,它从“看到”这一层开始,一共有9层,就记作9度。因为一篇文章中IR的出现并非就一次,所以IR句子的层次复杂度也就有若干个数值。本文中取所有IR句子层次复杂度的平均值作为整个文章的IR句子层次复杂度。

第三步:叙事结构的复杂度就等于IR分布度与IR句子层次复杂度平方和的算术平方根,这个平方根将反映文本中作者内部活动的复杂程度。用公式表示就是:

叙事结构复杂度 = SQRT(IR分布度的平方 + IR句子层次复杂度的平方)

这样的计算方法,既可以将作文文本中人物内部活动随现场情感激发的随机性以及特殊变化表现出来,符合人物情感的表达方式,又可以通过计算文本中内心活动的分布状况,将这种分布状况的随机程度和句法复杂度表现出来。

如图6所示,我们利用这种叙事结构计算方法对一个班级的写作文本进行连续两年的追踪研究,基于同一个话题重复测量四次,获得了学习者写作文本结构变化发展的数据。从这些数据中初步发现叙事过程的增长速度远高于其他情节单元,且与人们最为关注的心理活动描写在增长上形成了显著的数量差异,以至于人们误认为学习者一直关注于“记账”式的事情过程描写和叙述,而没有将作文中人物的内心等判断高质量作文的要素表现出来,好像经常在某个阶段来回徘徊,貌似进入高原期或静待期。其实,虽然内心应对(IR)的均值不高,但是IR数量和IR分布度在重复测量中仍然表现出了缓慢的线性增长趋势,这说明无论从描写内心活动的句子数量方面,还是这些句子的语法复杂度方面,学习者都是有增长的。只不过这些增长被快速线性增长的尝试解决所掩盖,形成了“高原期”或“静待期”的假象。实践证明,这种叙述结构的计算模型和方法是可以对学生写作文本中的相关规律进行系统研究的。

五、研究的结论及实践意义

本研究在三种国际上流行的文本分析途径的基础上,建构了“SEHL”叙事结构的分析模型,并积极采用句子编码的方式实现了对写作文本叙事结构的计算。在一个长达两年的技术促进语言运用的追踪研究案例中,这种叙事分析模型和计算方法初步显现出了效果,发现了网络环境下学习者写作文本结构发展的相关规律。一些一线教师一直都在对这个问题进行思考,即是不是所有的写作者都是从第一个情节单元“所处环境”顺次写到第六个情节单元“评价”呢?通过这个研究,我们知道并非所有的文体都完全具备上述六个情节单元,年龄阶段不同,写作能力水平不同,对上述六个情节单元的运用灵活程度也就有很大的差异。刚开始学习写作的学习者就非常善于从“尝试解决”这个情节单元入手进行写作,所有的情节单元未必都全部出现,而是在不同的学段时间点逐渐添加和完善的。叙事结构及其计算在写作文本分析中具有非常重要的实践意义,为从语言材料中提取出学习者的叙事结构提供了一种可计算的途径,为认识网络环境下不同学习者写作结构如何发展的问题,提供了一种有益的尝试研究和解释。