开篇:润墨网以专业的文秘视角,为您筛选了八篇句子翻译在线范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
在全球化的背景下,无论是沟通还是阅读,人们对于外语的使用日趋频繁,不同语言信息之间的转化需求日趋旺盛,远远超过了人工翻译的负荷,而互联网机器智能翻译服务恰好能填补这一空缺。以谷歌翻译为例,其目前每天为2亿用户提供10亿次翻译服务,处理的文字数量相当于100万册图书,超过了全世界的专业翻译人员1年能够翻译的文字规模。
互联网机器翻译服务总体上分为词语和句子两类,词典基本相当于公共资源,而句子翻译大多数情况下也只是提供一种参考,其服务质量不足以面向用户收费。因此,翻译服务整体多为免费,收费10余年的金山词霸也在2008年开始转向免费。这决定了其盈利模式与一般免费网络服务类似,以贩卖用户注意力的广告收入为主。
与此同时,互联网翻译服务提供商也一直在探索着新的盈利模式,以便从偌大的翻译市场挖取更大的价值。他们在机器翻译服务仍无法替代人工翻译这一弱点中觅得商机,一方面,聚集专业的翻译人才,通过互联网为用户提供专业的人工翻译增值服务;另一方面,建立在线外语教育平台,将翻译服务拓展至整个语言教育领域,并借助在线课程等方式盈利。
机器翻译服务:用户规模之争
艾瑞咨询调查数据显示,73.7%的用户会使用相关网络外语查询、翻译服务,渗透率仅次于网络购物、搜索和微博。按此渗透率进行估算,中国的网络翻译服务用户数约为4亿。庞大的基数吸引下,市场上的互联网翻译服务提供商众多,分为在线词典、词典软件、在线翻译网站、手机词典等多种形式,保守估计数量不下几十家,包括有道词典、百度词典(翻译)、谷歌翻译、金山词霸、Bing词典、QQ词典、雅虎翻译等,用户争夺异常激烈。
提供更准确、更丰富的搜索结果和更多样的附加服务是吸引用户的重要手段。在输入方式上,目前的互联网翻译服务多提供直接输入文本、上传文件、屏幕划词、手机拍照取词、语音搜索等多种选择。搜索结果则以网络释义、真人发音、视频例句等形式展示。此外,多数互联网翻译服务还提供单词本、情景例句搜索、离线翻译、网页翻译、中文百科等附加服务。
有道词典是目前中国用户规模最大的互联网翻译产品,截至2013年3月,其累计用户数量达到3亿,月活跃用户5000万,其中移动端的用户超过1.5亿。完善的服务是有道词典获取用户的法宝。其是“网络释义”功能的开创者,基于搜索引擎技术,在海量网页中挖掘最新的词汇和句子。2010年底,有道词典独家推出音视频例句功能,提供国际名校公开课、欧美经典影视作品中的例句。目前,广告是有道词典的主要盈利方式,客户包括宝马、中信银行、可口可乐、英语培训机构等,预计2013年内可实现盈利。
与之相比,以色列翻译服务提供商Babylon(BBYL,TASE)则已经依靠庞大的用户实现了盈利(附表)。Babylon目前拥有1.3亿用户,2012年底向美国纳斯达克提交上市申请。Babylon的盈利模式较为特殊:在依靠免费翻译服务吸引大量用户的基础上,其引导用户使用自身的搜索服务,再将用户的搜索请求加上用户位置、浏览数据等信息转给搜索服务提供商,进而与搜索服务提供商进行广告分成。除此之外,其也出售付费翻译软件给企业客户。
这一盈利方式决定了Babylon对搜索服务提供商十分依赖,尤其是谷歌,2012年,来自谷歌的收入占其总收入的83%。虽然它试图通过与更多的搜索服务提供商合作来摆脱对谷歌的过度依赖,但就像其在招股书中所言,一旦搜索服务提供商改变策略,其业务将受到严重的影响。
另外,如何引导翻译服务的用户使用其搜索服务也是难题。用户在安装Babylon软件的时候,需要把“将Babylon设为默认搜索”勾选掉,否则,Babylon便会成为用户浏览器的默认搜索插件,而这种插件,正是通常意义上的“恶性插件”,网络上询问如何将“Babylon搜索”清除的用户不在少数。
中国的翻译服务提供商尚未盈利,Babylon特殊的商业模式是否健康还有待考证,关键是基本不具有复制性。可以说,截至目前,网络翻译服务行业并没有找到可复制的、普遍性的盈利模式,这让人工翻译服务和在线外语教育平台成为整个行业探索的两条路径。
深度挖掘:专业人工翻译
机器翻译到底是否靠谱?“The sky Piaoqi the snow”、“The sky to float the snow”、“Sky snow”,从各大翻译工具对于“天空飘起了雪”一句的翻译足以看出“机器翻译内容可能存在明显错误,请自行判断使用”这句友情提示的重要性。
互联网机器翻译无法取代人工,却可以充当沟通媒介,连接起有需求的客户和翻译人员,形成翻译电子商务市场。如今,线上的翻译服务商走向线下招募翻译人员,在原有服务的基础上提供更为专业的人工翻译,而线下的传统翻译公司则依靠自建网站或加入翻译服务平台延伸至线上,拓展业务来源。
Babylon和有道词典均已推出了人工翻译服务。Babylon的人工翻译服务8美元起价,号称网罗了超过万名专业的翻译人员。网易有道推出的有道专业翻译,分为快速、文档、名称翻译三大类,其中,文档翻译又分为标准、高级、专业、发表四种不同的规格,满足不同客户的需求。此外,有道专业翻译还为客户提供排版、打印、盖章等额外的服务,另行收费。
另一方面,拥有丰富翻译人员资源的传统翻译公司则纷纷将其业务搬上网。2008年上线的随你译在线依托的是成立于2005年的北京凯德利澳翻译服务有限公司;365翻译网于2011年正式上线,其前身是一家具有近10年翻译服务经验的工作室;金桥翻译中心从2000年开始从事翻译业务,目前其通过网站为用户提供在线翻译服务。不过,目前直接通过互联网上传的翻译资料以简短内容为主,如果内容较为复杂,客户往往更希望能够与负责的翻译专员直接沟通,但传递资料和大部分沟通依然通过网络进行。
为了改变各翻译服务提供商各自为政的现状,2012年9月上线的语联网正在尝试打造一个全产业链的语言信息服务平台,它不仅计划搭建云翻译服务平台并建立智能型语料库,相同的信息不需要被重复翻译,借此降低成本,提高效率,还旨在整合翻译服务提供商和客户资源,为其提供对接的平台。不过其正式上线不到一年,整合能力仍有待市场检验。语联网迄今已经推出的服务包括译点通快速人工翻译、U2简历翻译、可使用中文直接与全球客户对话的全球畅邮以及移动终端翻译产品拍拍易等。
广度拓展:外语在线教育
在线教育领域如今炙手可热,语言学习又是其中较为“刚性”的需求,互联网翻译服务提供商可将翻译服务作为在线教育的入口,利用庞大用户基础和资源、品牌优势将其服务从单纯的翻译拓展到整个外语教育领域,丰富的学习资源可进一步提升用户量和用户黏性,付费在线课程亦可带来新的收入来源。
2013年5月,有道词典就在新的手机版4.0中,添加了涵盖英语考试类和学习类书目的云图书功能,向学习平台转型。同时网易有道还宣布了以有道词典为核心,带动在线教育和专业翻译两个并行产品的“一拖二”战略。
目前,网易已经推出了有道学堂,除包括背单词、口语练习、双语阅读等教育资源外,口语教学达人频道提供了在线培训课程,价格为1688元,有效期6个月+54天。这一课程形式多样,包括实地采访纽约人、听常春藤大学在校生讲故事等。网易有道还计划于2013年内推出全新的英语在线教育平台。
摘要:本文通过对机器翻译和人工翻译的比较,发现机器翻译有其速度快、效率高、词汇量大的优点,但也发现机器翻译存在的不足,比如翻译死板、灵活性低、句子歧义和存在文化因素的问题。通过举例,让我们对机器翻译存在的问题进行更好地探讨和克服,提高学生合理使用机器翻译的效率。
关键词:机器翻译 人工翻译 比较 学生 效率
1、引言
谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说:“孔子周游列国,在各地言语发音不尽相同,彼此交流甚少的当时,也不得不通过象寄之才(即翻译人员)以‘达其意,通其欲’。”在这个计算机盛行的时代,网络信息激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一,同时也是学生们不可缺少的学习工具之一。合理地使用机器翻译英语,使英语专业的学生更快、更容易地掌握好翻译的技巧。虽然它不能完全取代人工翻译,但进一步了解并充分认识其存在的问题及弊端,以便在机器翻译和人工翻译之间做出恰当的选择或进行有机的结合。
2、机器翻译的含义
机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理的一个分支,与计算语言学、自然语言理解之间存在着密不可分的关系。用以完成这一过程的软件叫做机器翻译软件。机器翻译之所以成为可能,一是因为两种语言之间存在着可译性,二是因为人的翻译过程具有可模拟性。
3、机器翻译软件及介绍
3.1 Babylon
来自以色列最强大的英文翻译软件,在全球已有超过70个国家2千2百万人使用。Babylon提供最专业英文翻译,有别于一般的翻译软件,Babylon最迷人的是可外加其他语言字典,提供让您翻译一次可同时得到其他语言的翻译。
3.2 谷歌金山词霸豆豆
是金山公司词霸家族全新打造的一款在线词典查询工具,是词霸向互联网转型的重要一步,目的在与通过互联网给广大英语学习用户提供即时、小巧的在线英语查词工具,通过互联网给用户提供更实时、更贴切的语言学习服务。
3.3 网译
拥有超过500万不重复词条数目,可谓庞大经抽样测试Dict.CN目前的词库己能基本包含印刷出版的权威词典所应该收录的所有单词,同时还包含了大量未经广泛使用和正式收录的词汇。词库目前涉及的专业种类包括了化学,生物,医药,计算机,土木,机械,工业,体育,政治,宗教,日常生活,工作求职,服饰打扮,食物菜谱,职称岗位,影视书籍中英对照名等等。
4、使用机器翻译英语的现状
从1954年第一次机器翻译试验成功到今天,一直被认为是一个大有可为的计算机应用领域。用户的需求是推动技术发展的原动力。随着我国计算机技术应用的普及和提高,计算机用户和上网人数迅速增长。许多流行软件和外国网站都是英文的,而且Internet上的信息绝大多数也是英文的,这严重地影响了国内用户的使用,因此对翻译软件的需求也日益增长。机器翻译为用户提供计算机应用过程中的阅读或写作帮助,此类软件通用性较强。此外,机器翻译软件近几年在学生中盛行。非英语专业的学生常用机器翻译选择题、完形填空、阅读理解里存在的陌生的单词、句子,他们追求的是把意思搞懂,不影响整个句子或者整个文段的理解即可。英语专业的学生通常用此类软件去深究文段里的内涵意思以及了解中文里的成语、谚语、俗语等翻译成英语的知识。
5、使用机器翻译英语的优点
5.1 速度快,效率高
机器翻译的基本优点是速度快、效率高,这也是受英语专业学生欢迎的原因之一。例如一段中文需要翻译成英文,用机器翻译只用复制粘贴就可以出来基本成形的英文,只要再花一点时间去修饰去调整就搞定了;而人工翻译却需要大量的时间,有时候常常忘记单词如何拼写,造成效率低、速度慢的结果。
5.2 词汇量大
现在的学生普遍出现词汇量短缺的现象,一些陌生的词语很难找到与其对应的英文单词,于是就用一些常见的单词代替,这就造成翻译后的英文不优美,太过于平常以及失去了作者想表达的意思,一段优美的中文翻译成英文就黯然失色。而且一些常用的成语、谚语、俗语都记不住或者混淆,有时候自己造的可能存在很多语法错误或者太过繁琐的问题。机器翻译能帮学生解决这个问题,再偏的中文词语它都能帮忙找到合适的英文单词,而且有些成语没有固定搭配的,它也能提供多种翻译供学生们选择。
6、使用机器翻译英语的弊端
6.1 翻译死板
使用机器翻译只是句法结构的和词汇的机械对应,对源语言的分析只是求解句法关系,完全不是意义上的理解。当碰到段落一句一句处理时,上下文又缺乏联系,翻译结果无法让读者看懂,与语言本身的灵活性存在差异。而人工翻译就能先理解整篇文章的意思,再根据需要适当地调整翻译顺序,这样读者就一目了然了。
6.2 词义选择和句子歧义问题
多义词是英文中普遍存在的,即一个单词有多种意思,现在的机器翻译还不能从多个意思中选择适当的一个,这是阻碍机器翻译的一个难题。例如:It was on the morning of Februarythe ninth that I arrived in London.机器翻译的结果就是它在2月的早上第九我到达了伦敦,而它正确的译文是2月9日早晨我到达了伦敦。在没有语境的情况下,英语句子常常存在着歧义。例如:He hit the boy with a stick.人工翻译有两种译文:“他用木棍打了那个男孩”或者“他打了拿着木棍的男孩”,而机器翻译的结果就只有第一种。
6.3 文化因素的问题
对带文化色彩的语句,机器翻译和人工翻译真是有着天壤之别。例如:Pandora’s box.这句话的意思是潘朵拉的盒子,源自于希腊神话,而机器翻译会翻成Pandora箱子,以此看来,机器根本无法识别“Pandora这个词。人工翻译一般可以通过音译加注、释义、增益、归化等灵活手段来对遗漏的文化信息进行补充,而机器翻译几乎是不可能的。如果都使用机器翻译,那么大量的文化信息就会在翻译过程中遗失,以至于读者在译文中得不到原文所表达的意思。
关键词:大数据时代;英语专业;翻译课程
一、大数据对英语专业翻译课程教学的影响
(一)教学资源的丰富化
教学资源是指为保证教学活动有序、有效展开而提供的信息、技术和环境的总和,如教师、教材、教室、实训基地、教育政策等。大数据时代前,英语专业翻译课程的教学资源主要是教师、教材、教室等传统的教学资源,且这些资源非常有限。在大数据时代,各类平台资源、信息资源等教学资源不仅门类齐全,而且内容也极其丰富。如Blackboard网络教学应用管理平台、慕课、微博、网络论坛等平台资源;如电子图书、课件、习题库、网络音视频等信息资源。这些教学资源交互性和时效性强,不仅给教师组织教学带来了多样化的选择,也能给学生多种感官刺激,提高其学习兴趣和学习效果,使传统教学和信息传播模式得以改变。而对大数据时代英语专业翻译课程的教学而言,因英语是世界第一官方语言,其教学资源就变得更加丰富化和多样化。
(二)教学方式的在线化
在线教学是指利用计算机技术和互联网技术进行知识传递,使学生与教师即便相隔万里也能突破时空限制而展开的教学活动。因具有形式灵活、成本低廉等特点,在线教学在近些年来的发展速度非常快。有研究表明,目前韩国继续教育的主要模式就是在线教学,其78%的高校都建立了在线教学平台,供学习者使用;另有研究预测,到2018年,美国利用网络进行学习的学生人数将会超过面授人数。以大规模开放在线课程慕课与英语专业翻译课程的结合为例,通过引入英语专业翻译课程慕课平台,将课程参与、反馈、作业、讨论、评价、考试等诸多环节全部呈现在平台上,学生可以运用“在线学习”和“课堂面授”的模式进行混合式学习,能全面提高其学习翻译课程的兴趣、参与程度以及合作意识,进而真正实现课程教学质量与效率的提高。同时,与慕课联系紧密的微课和微课程也能较好地实现英语专业翻译课程教学方式的在线化。
(三)教学评价的互动化
教学评价是遵照教学特点和教学规律,科学设置教学评价指标和评价项目,对课堂教学相关活动进行系统的价值认识、评定和判断的活动和过程。在传统教学中,学生的译作只能由教师批改,评价大多由教师书面给出,这种单向模式下教师所提供信息量不多,学生参考价值有限,同时,学生也因无法与教师直接沟通、互动而对部分知识点依然无法深入理解。而大数据的应用改变了这种单向评价模式,对学生课堂内外的翻译任务的评估不再局限于教师的书面形式。教师可以通过学校的教学平台组织在线讨论,与学生进行广泛深入的交流,也可通过“课后论坛”或者微信、微博等新媒体手段进行师生间、生生间的交流和互动。因而,大数据时代英语专业翻译课程的教学评价完全可以实现全方位的互动化。
二、大数据时代英语专业翻译课程教学面临的挑战
(一)过度依赖网络教育教学资源
目前,大数据技术、云计算技术与高等教育的结合越来越密切,网上教育教学资源的丰富与便捷也让教师和学生爱不释手,但网络资源也正在给高等教育教学带来一些消极影响,如师生过度依赖网上教育教学资源。部分英语专业翻译课程教师用惯了别人的课件、习题,觉得省事,就经常“顺手牵羊”使用一些网络上的现成东西,不去开发一些具有原创性的学习资源;更有部分英语专业翻译课程教师现在基本上不板书,仅仅从网络上下载现成课件,然后东拼西凑地组装到一起;部分学生在完成翻译课程相关练习或作业时也不经思考,直接用手机或电脑通过搜索引擎、在线翻译软件等工具来完成。过度依赖网上教育教学资源会导致教师对教学内容不熟悉,影响教学效果,也会导致学生不去思考和领悟翻译技巧和方法,影响学习效果。
(二)导致学生抵触传统教学方式
经过几十年的厚重沉淀,英语专业翻译课程的传统教学方式积累了很多课堂教学经验,具有诸多不可替代的优势。如教师授课时,通过面部表情、肢体语言和学生进行人性化交流;教师讲授时,会有意地将自己对翻译的独特领悟与学生分享,潜移默化地影响学生。然而大数据时代下,伴随着网络媒体的兴起、移动终端在教育教学领域的广泛应用,越来越多的学生过于依赖便捷的平板电脑、手机等移动终端搜索符合其偏好的视频、音频、文字等网络英语翻译学习资源,久而久之,导致其对传统翻译课程的教学方式产生抵触情绪。特别是当教师用传统的方式在课堂上呈现与网络资源重复的教学资源时,学生会更加抵触传统的英语翻译教学。
(三)网络教育教学资源本身需要鉴别
在大数据时代,每天都有大量的信息充斥于网络,信息的更新、获取、提炼对现代人的日常生活与工作形成了巨大冲击并产生了深远影响。在网络上,除了在线翻译软件外,有许多关于英语翻译的信息资源,如译作、学习笔记等。然而,这些资料中的绝大部分并没有通过专家审阅,可能本身就存在错误之处。如教材改版了,但网络上并没有更新后的课件,而部分教师不加甄别直接下载这类课件讲课,这就使得教材改版失去了应有的意义。部分学生在进行翻译练习时,不假思索直接从网络上抄袭答案,而部分答案本身却存在错误或纰漏。笔者的一次调查发现,35个样本中有24个在完成翻译练习时直接抄袭了网络上的句子或段落,而这些句子或段落有60%存在错误。可见,在大数据时代,虽海量信息蜂拥而至,但这些信息良莠不齐,需要使用者有效鉴别,拒绝错误和垃圾信息。
三、大数据时代英语专业翻译课程教学改革对策
(一)合理利用网络教育教学资源
大数据时代,网络教育教学资源的日益丰富是社会发展的必然。如何合理、有效利用网络教育教学资源是高等教育各参与主体必须面对的问题。从学校角度看,各高校应根据时展趋势,高度重视网络教育教学资源的有效利用,设计出一种基于本校师生需要的网络教育教学资源管理平台,尽量把校内外优秀的教育教学资源存储到学校平台上,供全校师生使用。从教师角度看,各英语专业翻译课程教师要在备课、授课等环节把自身对翻译的理解、多年来积累的经验等融入教学之中。从学生角度看,在完成作业时,首先需要深入思考,不能直接利用网络教育教学资源来完成作业,只有这样才能真正提高翻译技能,形成自己的翻译风格。总之,无论教师还是学生,都不能过度依赖网络教育教学资源。
(二)综合运用现代与传统教学方式
教师是课堂教学的组织者、引导者和合作者。在大数据时代,对于英语专业翻译课程的教学而言,教师要扮演好组织者、引导者和合作者多重角色,灵活运用现代教学方式与传统教学方式至关重要。首先,教师要认识到传统教学方式的价值和优势,对于一些重要的翻译理论、习惯用法等内容,应主要利用板书、设问、提问、分组讨论等传统教学手段,⒎⒀生思维。对于一些个人独特领悟,教师也应尽量使用传统教学方式。其次,对一些涉及文化、政治等内容的翻译实践,教师应尽量利用现代教学方式,将一些翻译作品图文并茂地展示给学生,加深其理解。总之,英语专业翻译课程教师不能一味地追求现代教学手段,应综合利用各种教学方法,消除学生可能的抵触情绪。
关键词:双语教学;双语师资;双语教材;教学改革;考试改革;管理制度
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2013)38-0212-03
一、电子信息工程专业需要双语教学
根据国际工程师培养要求,我们必须走全球化道路,全世界的科技资料63%以上是以英文来表达的,电子信息工程专业的主要专业课程为《计算机网络技术》、《电子测量技术》、《电子工艺技术》、《嵌入式系统原理及应用》、《光纤通信技术》、《移动通信技术》、《数字信号处理》,这些课程的特点是:比较新的技术主要来自发达国家的期刊和会议资料,绝大多数用英文表达。近几年随着广东省工业技术改造的升级和转型,引进的自动化电子设备、各种电子仪器仪表说明书一般是英文说明书,或者出口的电子产品说明也要求用英文。为了提高电子产品在国际上的竞争力,经常要派电子工程师到国外进行学术交流,也有的同学毕业后在企业从事电子产品出口销售工作,由于英语水平有限,往往无法用英语与外国经销商进行交流,这些问题都要求电子信息工程专业必须开设双语教学。电子信息工程专业从2008级开始开设了《电子测量技术》、《数字信号处理》两门课程双语教学,英语四级过级率达92%,在全院名列第一。2009级电子信息工程专业开设了《电子测量技术》、《计算机网络技术》两门双语教学课程,英语四级过级率达87%,2009级通信工程专业没有开设双语教学课程,英语四级过级率只有37%,可见双语教学对提高英语水平有很大的促进作用。
二、本专业双语教学的探索与研究
所谓双语教学,就是用英语进行专业课程教学,让学生学习电子信息工程专业知识的同时,提高学生本专业英语水平,这是对公共英语教学的延伸。近几年我们主要在教学方法改革、校本教材建设、师资队伍建设、考试改革、教学管理制度等方面进行探索与研究。
1.双语课程的选择。双语课程的选择是搞好双语教学的第一步,根据教学合格评估要求,每个专业最好安排两门本专业相关课程作为双语教学课程,首先要考虑是否有合适的双语教学教材及课程的难度,如果选一门专业课本身难度很大的,再加上双语教学,学生可能会放弃该课程学习。其次,双语教学最好选择紧跟本学科本专业前沿的课程,这种课程的国外教材相对比较好找,如选不到合适的教材,教师也可选择一些英文论文作为双语教学参考资料。如电子信息工程专业选择《电子测量技术》、《数字信号处理》、《计算机网络》作为双语教学,其中《数字信号处理》这门课程学习难度比较大,学生学习效果不好,其他两门课程学习效果比较好。
2.因材施教,克服“英文恐惧感”是前提。广东二本B线的学生高考录取线一般为470多分,据2012级4030名新生入学英语成绩统计,英语总分150分,他们的成绩分布为:40分以下占2%,40~50分占5%,50~60分占7%,60~70分占12%,70~80分占19%,80~90分占20%,90~100分占17%,100~110分占12%,110~120分占5%,120~130分占1%。面对这样英语成绩的学生,首先从新生入学开始,专业负责人或系主任通过新生入学专业教育讲座、开主题班会及课后谈心等形式帮助学生树立正确的学习态度,请本专业往届毕业生回校谈谈专业英语在企业的作用,帮助他们逐步意识到英语和双语教学的重要性与必要性。在公共英语教学时,根据不同分数段学生进行分班教学,加大对英语成绩差学生的课外辅导工作,逐步提高他们的英语水平,学完公共英语,基本消除了英语成绩两极分化问题,这些学生也逐步消除了“英文恐惧感”,这是双语教学改革能否成功的前提。
3.提高教师双语教学水平是关键。双语教学的教师不能是光懂英语的教师,首先必须有较强的本专业知识和能力,同时还要有专业英语水平和较高口语表达能力。为了建设一支较强的师资队伍,我们采取引进和培养相结合的办法,目前引进两名本专业的海外留学人员,另外派两名专业能力较强的老师到外语学院进修英语,这样就有了一支较强的双语教学队伍。为了提高双语教学水平,我们特地邀请外语学院的教师来听我们的双语教学课程,外语学院教师也了解双语教学的进展情况,这样也有利于公共英语的教学改革,我们学院的专业教师也经常听双语教学课程,教师互相交流,教学水平就有了较大的提高,有了较高水平的双语教学,学生的学习积极性有了较大提高,出勤率比较高。实践证明,提高教师的双语教学水平是双语教学改革能否成功的关键。
4.课前准备必须充分,课堂随机应变。双语教学本身教学难度较大,为提高教学效果,教师必须花多倍时间进行课前准备。首先对该课程教学内容进行整理,做到有条有理,层次分明,重点突出。其次还要根据学生的英语水平和专业能力,要做好课前充分英语和专业两方面准备。同时还要根据课堂实际情况,随机应变,必须把握好学生的实际接受能力及课堂信息量的关系,在达到最佳的教学效果。
5.处理好课外与课内关系。根据教学安排,一般双语教学专业课程为36~54学时,课内教学时间非常有限,为巩固和提高课堂所学专业知识和英语能力,要求学生在课外做到:①在认真复习、理解本次所学专业课程的内容基础上,还要掌握电子信息工程专业词汇和一些科技英语固定句子表达方式;②根据教学进度,学生要预习好下次课内容,有目的带着一些专业和英语问题去听课;③根据教师安排,课后阅读或翻译由教师提供的一些仪器英文说明书材料。经过一定时间的课内外学习,学生会不仅在学习好该课程知识能力的基础上,还能提高英语在电子信息方面的应用能力,学生学习积极性与主动性将有所提高。
6.处理好网络在线翻译问题。随着计算机软件水平的提高,现在网上出现谷歌、百度、金山、有道等在线翻译软件,确实给英汉翻译和汉英翻译带较大的方便,有的同学甚至老师认为没必要学英语,更没必要开双语教学课程。但从近几年毕业设计英文摘要可以看出,这些软件翻译存在句子结构中没有谓语或多个谓语等种种问题,特别不能正确翻译科技文章,如学生在毕业设计摘要中有一句“单片机以体积小、功能全、价格低廉、开发方便的优势得到了许多电子系统设计者的青睐。”的句子,用有道在线翻译为“MCU with small volume,complete functions,low price,easy to develop the advantage of the many electronic systems designers of all ages.”,很明显句子没有谓语,反过来再用有道翻译为中文“单片机与体积小,功能齐全,价格低廉,易于开发利用许多电子系统设计师所有年龄的。”,可见错误百出。正确的人工翻译应为:“The advantage of MCU with small volume,complete functions,low price,easy to develop ,is liked by many designers of electronic systems.”,可见软件翻译绝对不能取代专业人工翻译。
7.考试改革。根据教学大纲要求,考试要全面考核该课程的专业知识点,同时还考核学生在实际工作的应用英语的能力,学习成绩还应在整个教学过程有所体现。所以在学成绩中平时课堂表现占10%,课外作业占30%,实验课占20%,期末考试占40%,期末试卷用英文出题,允许学生带字典,学生解题必须用英文。考试结束后,教师给学生讲评试卷,反馈存在的问题。同时还要对试卷进行分析,对教学中存在的问题,提出建议和改进措施,为下次教学改革积累经验。
8.教学管理制度改革。双语教学改革必须要有相应的教学管理制度配套,双语教学难度较大,教师花了大量时间和精力,而得不到学生好评,造成有些老师往往不愿意进行双语教学的问题。为此学院在政策采取有效的措施,鼓励教师开展双语教学,上双语教学的课时费是普通课程的1.7倍,在评优秀教师和职称评定等方面给予优先考虑,这样教师进行双语教学的积极性得到大大提高。
我校通过近几年双语教学的研究与实践,积累了一定经验,取得一些成果,如2008级电子信息工程专业的英语四级过级率达92%,本专业英语水平也显著提高,得到用人单位的好评。但是双语教学在师资队伍建设、教材建设、课程建设、考试改革、制度建设等方面还需不断完善和提高。
参考文献:
[1]曾昭英.高校数学专业双语教学的思考与实践探索[J].大学教育,2012,(2).
关键词 网上作业;在线考试;Ajax;遗传算法;自动批阅
中图分类号:TP315 文献标识码:B 文章编号:1671-489X(2013)06-0052-03
英语是人们相互了解学习的“桥梁”工具之一,也是当下有知识的年轻一代应该掌握的基本技能之一。大学英语作为在校大学生必开的一门公共课程,承担着让大学生熟练地掌握与运用英语的重担。但目前的课堂教学,具有教学时间长、任务重、实践性强、短时间难以提高等特点,因而必须采取有效的措施改善学生学习英语的环境,进一步促进学生熟练地掌握和运用英语的能力。大学英语网上作业和在线考试系统将是行之有效的改进措施之一。
1 系统采用的技术平台
本系统采用最新的Web技术开发包 Ajax。它能让开发的Web应用程序直接通过客户端的Ajax引擎向服务器传送需要更新的数据信息并返回,然后利用客户端的JavaScript处理返回的数据,避免了“闪屏”现象的发生。同时,区别于传统Web信息独占式请求发送方式,Ajax采用信息异步请求发送方式,并且有一些操作就是在客户端上处理的,因而服务器处理响应所需的时间大大减少[1]。两种信息发送方式如图1、图2所示。
2 系统主要功能
2.1 学习功能
系统添加了听力、完形填空、阅读理解、翻译、作文等题型,让学生在课外的时间通过对各题型的学习,进一步理解和巩固所学知识;并提供客观题的正确答案与解题思路以及主观题的参考答案供学生学习,以便及时发现问题,纠正错误。
2.2 网上作业功能
在本系统中,教师可以通过此功能模块对学生布置大量的客观题以及翻译等简单类型的主观题作业,并设置好客观题的正确答案和客观题的关键词语,实现学生完成作业后点击提交,由系统实现学生作业的较准确的自动批阅,并记录学生成绩。它既巩固了学生的所学知识,又减轻了教师批阅作业的负担。
2.3 在线考试功能
在本系统中,教师可以通过系统在原有的试题库或者修改后的试题库里通过遗传算法进行组卷,学生在特定的时间、地点通过计算机完成考试。考试提交后,将由系统对学生的客观题进行批阅,并将分数保存记录下来;主观题则由教师批改后记录为学生的主观题得分,最后由系统将学生考试的主客观题所得分数相加作为学生的考试成绩。在一定程度上,克服了教师出题的片面主观性,客观题由计算机自动批阅,在减轻教师负担的同时也降低教师人为失误所造成的记分错误,提高考试检测的准确性。
3 系统构成模型与主要模块功能介绍
3.1 系统构成模型
为了更好地实现大学英语作业的网络化与考试的在线化以及试题的自动批阅等功能,设计出符合要求的系统来,设计好系统构成模型图,如图3所示。
3.2 主要模块功能介绍
本系统在开发时为了能全面可靠地实现大学英语网上作业与考试的在线化,设计了以下相互作用的模块。
1)用户模块:对用户的账号和权限进行管理,主要包括对管理员、教师、学生的操作权限进行设置,添加用户,修改用户资料,删除用户等操作。
2)登录模块:用户在登录界面上输入用户名和密码后,系统将判断用户是否非法;输入正确的用户名和密码后,系统会根据用户的权限让用户进入到相应的页面进行操作。
3)学习模块:教师在此模块可以添加各个类型的学习资料及其参考答案;学生则通过此模块进行学习。
4)作业模块:教师通过此模块布置作业给学生;学生在网上完成作业,提交系统进行批改并计入学生的平时成绩。
5)题库模块:对试题库进行管理,将设定好的题型、分值、难度等属性的试题添加到试题库中,以及删除修改试题。
6)组卷模块:由系统通过改进后的遗传算法实现对试题的低重复使用(同一试题在近两年试卷中的使用率)与难度适中的合理搭配,完成试题组卷。
7)考试模块:教师在此模块导入系统已组卷好的试卷;并设置考试的开始和结束时间;学生通过此模块调用试卷进行考试,并提交系统批改。
8)成绩模块:教师在此模块主要是设定好学生作业及在线考试的标准答案,由系统对学生提交的客观题和作业中的诸如翻译等简单主观题进行评分,并记为学生的部分成绩,与教师对学生考试主观题考试得分相加,计为学生考试成绩。
4 关键模块功能的实现
4.1 改进遗传算法,实现组卷的优化
传统遗传算法中最普遍的问题是早熟收敛,主要是因为选择、交叉以及变异算子应用不正确或相关的控制参数选择不恰当等原因的影响,造成通过试题的适应度函数所抽取的试题不一定就是试题库中最具适应性的试题[2]。试题的最准确适应值是通过试题的各个属性值来界定的,因而为每道试题在导入试题库之前要添加增加难度、区分度、知识点、章节、题型、总时间、总分数等属性值。在试题抽取的过程中,通过试卷的题型、每题型分值、总分数、总时间、难度区间值、难度系数等数值,由系统将试题库中符合设定好难度区间值的试题筛选出来,然后从各题型中选取设定好数目的试题,让其满足下列公式1:
其中,Stotal为试卷的总分数值,Ttotal为试卷的总时间值,Dtotal为试卷的总难度值,而St[i]、 Tt[i]、Dt[i]则分别为抽取出来的各道试题的分数值、时间值和难度值。满足以上条件的试题组成的试卷将是一份最优化的考试试卷。
4.2 简单类型主观题自动评分算法的实现
现有的在线考试系统中,已实现客观题的自动批阅,技术成熟;但主观题的自动批阅因受同义词、语言叙述方式的影响,难以给出一个标准答案而难以实现。这也成为影响在线考试系统应用的一大技术难关。在本系统,为了减轻教师批改作业和试卷的部分负担,同时又不影响准确率,对填空题采用基于词典的逆向最大匹配算法的切分词技术来统计每道题的得分点数,并将得分点数相加作为本主观题的最后得分;而对翻译题采用切分词技术和语义相似度相结合的方式计算最后得分。
基于词典的逆向最大匹配算法的切分词技术,就是在数据库中为每道题建立一个与题号相对应的关键词词典库,在自动批阅时系统对学生的答案按照从右到左先提取m个字符(m为词典中设定的最长词条的汉字数),与对应的词典中关键字进行匹配。如匹配成功,则得到一个得分点;如不成功,就将部分字符串切取出来重新与词典关键词进行匹配,直到剩下最后一个字。语义相似度主要考虑到教师在批改主观题时,给出的分数不仅仅是得分点多少,同时会考虑语义表述是否达意。因而还要考虑得分点所在句子与标准答案的语句相似度,给出一个修正得分权值,两者相加得出此题的最后分值[3]。这就需要进行语义相似度计算,如公式2:
Sim(A,B)表示A、B两个句子的相似程度,NSame(A,B)表示A、B两个句子中相同字个数,Numb(A)则表示A句子中字的个数,Numb(B)则表示B句子中字的个数。当Sim(A,B)值大于0.9时,基本上完全相似,语句相似度分值给满分;当Sim(A,B)值在0.7~0.9时,语句相似度分值给75%;当Sim(A,B)值在0.4~0.7时,语句相似度分值给50%;当Sim(A,B)值在0.1~0.4时,语句相似度分值给25%;当Sim(A,B)值小于0.1时,语句相似度分值给10%[4]。
最后,将切分词后所得的关建词分值加上语义相似度修正权值得到该主观题的总分值。因考虑到正式考试时的高准确率要求,在目前主观题评分技术还不成熟的情况下,对语言表达形式的主观题,还是采用人工阅卷的方式进行。
5 总结
本系统为学生提供了课外学习和自我检测的相关资料,利用改进的遗传算法提高了组卷的科学性,利用基于词典的逆向最大匹配切分词技术和语义相似度相结合的方法来自动批阅简单类型主观题,在促进学生提升自身英语技能和考试公正性的基础上进一步减轻教师的负担。
参考文献
[1]于明鑫.利用AJAX引擎提升在线考试的性能[J].辽宁师专学报,2009,11(2):64-65.
[2]王淑佩.基于改进的遗传算法组卷系统应用研究[D].长沙:湖南大学,2005.
关键词 语料库 真实语境 语言服务
中图分类号:H030 文献标识码:A DOI:10.16400/ki.kjdks.2016.11.069
Abstract With the development of information technology and big data, corpus which is based on real context plays an increasingly important role in the construction of language service platform. This paper planned to construct an integrated language service platform, including a set of language learning, testing and translation, which is based on the disciplines of School of Foreign Languages in Shanghai Jiao Tong University, and also the large-scale parallel corpus and dedicated Corpus developed dependently.
Keywords corpus; real context; language service
上海交大外语学院目前正在自主研发4000万字词大规模英汉平行语料库和法律、医学、航空等专用语料库,在此基础上,计划建设一个集语言学习、测试、翻译于一体的综合性语言服务平台。其特点是依据的语料真实,可信度高,功能多样。
该平台主要分为三个部分,第一部分是自主语言学习模块,第二部分语言水平测试模块,第三部分是语言翻译模块。其中,每一部分都包括通用语言服务和行业专用语言服务两大功能,可以满足不同用户多样化的语言需求。
1建设基于语料库的语言服务平台的背景和必要性
语言学中,语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体,可用于机助翻译、双语词典编撰、外语教学、语言测试等应用领。
1.1 国内基于语料库的语言服务行业现状与分布
上世纪八十年代以来,随着语言处理技术的不断革新,跨文化交流活动的日益频繁,国内外语言产业获得快速发展,产业形态日益多样化,由原先的语言翻译和语言教育服务等业态扩大到语言处理、语言能力提升和品牌名牌命名及品牌文化评估等业态,产业总值呈几何级数增加。
目前,语言服务创新资源主要集中于北京、上海和广州等地。北京和上海均有一定数量的高校和研究机构从事语料库建设与研究,较有影响力的有北京大学计算机系、北京外国语大学中国外语教育研究中心和上海交通大学外国语学院。
1.2 语言产业中语料库的应用现状与需求分析
国内语言服务需求具体表现为以下趋势:外语培训和语言翻译服务发展势头猛;语言处理产业落后,各种语言支持服务的技术产业发展缓慢;品牌命名产业和针对功能性语言障碍的语言能力提升服务尚未启动;汉语言文字的现代信息化处理技术仍有较大上升空间,汉语国际化的产业化水平低。根据以上分析,本项目主要集中于机助翻译技术、语言教学与能力测试几个方面:
(1)机助翻译技术。基于规则的机助翻译使用句法规则作为句式转换的基础,而常规的统计机助翻译利用网络语料对翻译引擎进行训练,利用双语语料库进行句对齐、词对齐,利用单语语料库构建转换规则。目前的趋势是将人工翻译的高质量语料利用统计机助翻译系统进行训练,再利用机助翻译的结果进行译后编辑,以提高翻译效率,这已经成为部分跨国企业的常规实践。
(2)语言教学与测试。语料库语言学在语言教学和语言测试中具有非常重要的作用。它可以帮助教师和学生了解语言中的典型现象,如词汇量、词汇频率、搭配、习语、语义韵、难度、文体特征、翻译对应词等,许多过去全凭老师个人直觉的东西如今可以通过快速处理大规模数据得到验证,从而使教材编纂和教学大纲更加客观科学,也使语言教学更加高效。
2 语言服务平台建设的内容
2.1 语言服务平台的主要内容
本项目主要依托上海交大外国语学院的外语学科,以自主研发的4000万字词大规模英汉平行语料库和法律、医学、航空等专用语料库为基础,建设一个集语言学习、测试、翻译于一体的综合性语言服务平台。该平台主要分为三个部分,第一部分是自主语言学习模块,第二部分语言水平测试模块,第三部分是语言翻译模块。其中,每一部分都包括通用语言服务和行业专用语言服务两大功能,可以满足用户多样化的语言需求。
2.1.1 经过标引处理的英汉语料库系统
大规模英汉/汉英语料库是本项目的灵魂,是各项翻译研究、实践、教学以及其他应用研究的基础。交大外院在20世纪80年代就建立起具有世界领先水平的科技语料库。目前外院正在研制的大规模英汉/汉英平行语料库以及为当代英汉/汉英平行语料库的建设提供了重要物质基础,为机助翻译的研发奠定了良好的基础。
项目正在建设的总字数达4千万字词的英汉双语双向平行语料库,同时,已经建成若干行业专用语料库,如航空科技英语语料库、医学英语语料库。具体流程如下:
(1)语料采集。文本采集对象主要为高质量的文学作品、新闻稿件等真实语料。文本主要通过人工键盘输入、人工扫描以及通过网络下载等方法,并以纯文本形式储存。
(2)语料的加工。通过运用语料库建设技术,对采集的文本进行消除噪音信息处理,并实现双语文本在篇章、段落层面的对齐;同时对选用的语料素材进行信息标注(如语料素材的作者信息、出处、题材类型、语言质量等),对语料素材建立一个评价的基本信息库。
(3)语块匹配。通过计算机的语块计算和提取技术,建立双语对应具翻译意义单位的语块匹配数据库,形成平行语料库核心信息,为汉英翻译和教学等应用提供基础。
(4)频数与概率分析。对于语块数据库,通过频数和概率的计算机智能分析,统计出本语料库中各种表达的意义、使用的语言形式和实现的功能的频度和概率等基本信息。
(5)建成平行语料库。实现双语文本在句子层面与语块层面的对齐,建成平行语料库。
(6)构建汉英对应的辞典库。在建立英汉/汉英语料库的同时,建立一个汉英对应的数据库,作为语料库机助翻译时的一个辅助系统。
2.1.2 英汉机助翻译系统
交大外院的翻译平台以自主研发的海量英汉语料库为基础,以真实语境为翻译核心,采用基于语块匹配的翻译原理,以此实现最准确的语义翻译状态。同时,根据已建成和即将建成的行业专用语料库,开发出更适合具体行业应用的翻译软件。
本系统是实现英汉互译过程中极其重要一项,目的在于向使用者提供一N方便、准确、具有亲和性的在线英汉互译应用服务。
(1)检索、匹配模块。本系统的关键在于建立一个智能化的语料库翻译检索模块。通过系统中的语块计算与提取、双语文本语块模糊与精确匹配等技术,将需要翻译的源语言与核心数据库中积累的大量而真实的且经过标注处理的双语语料在语块、句子等层面进行匹配,找出一系列匹配性佳的双语语句。一般做到提供5句最适匹配状态的译文语句,供译者根据个人文风选择。
(2)翻译编辑模块。基于检索、匹配模块,以语块为主从语料库中匹配出需翻译语句的参考句,作为翻译编辑的基础;并且智能化地提供相应参考句的评价信息(如语言质量评价A、B、C三级和引用率),需要时提供参考句所处的段落语境。本模块以匹配性最适的语句作为译句的翻译参考句,译者也可以根据自己文风偏好选择其他匹配的语句作为译句的翻译参考句。有助于译者对机译文本进行科学、合理的修饰、完善。在此基础上,再辅以一定的常用的机助翻译技术和汉英双语专业科技词典库,向译者提供可靠的翻译文本。
(3)终端显示模块。显示模块核心主要有源文本输入窗口、参考语句窗口、译文编辑输出窗口。在整个窗口操作过程中,所有操作尽可能由鼠标来完成,减少人工输入的时间。
2.1.3 语言能力测试系统
该系统根据建成的语料库,采用外院自主研发的语言测试系统,对语言学习者的语言水平进行能力测试,并根据测试结果推荐其学习与能力相适应的课程。
欧洲共同语言能力分级(A1入门级 A2基础级 B1进阶级 B2高阶级 C1流利级 C2精通级)为基础,划分语言学习者的能力等级。
2.1.4 语篇模式教学系统
这也是本项目的其中一大特色。我们将根据交大外院教师丰富的教学经验,结合翻译平台系统的建设,为公众提供一种创新性的基于真实语境的语言教学方式,并提供可量化的教学评估,向实证教学模式转变。本系统由四大模块构成。
(1)语篇分析模块。基于建成的海量语料库,通过文本分析与数据检索技术,对语篇进行引言、研究方法、数据结果、讨论等方面的分析。系统设定有最适语篇教学长度,也可自行选定语篇长度。
(2)常用句子结构分析模块。基于频数和概率分析技术对句子结构分析,归类出生活中或具体行业中常用的文献句子结构,显示对应语料库中的语篇,从而给英语的写作与翻译学习给出指导。
(3)常用词组、搭配模块。基于频数和概率分析技术,提取双语语料库的常用词组及其搭配进行分析、练习,掌握生活中或具体行业中常用词组搭配习惯和技巧。
(4)自我练习翻译模块。在本模块中,学生可自行选定需要练习的内容,将练习译文与语料库范文对比。本模块基于双语文本语块模糊与精确匹配技术,通过句式模板对比、同义词对比、语义相似度对比,对用户自我翻译质量提出评价以及相应的建议。
2.2 技术创新特色
本项目的核心创新点主要体现在如下几个方面:
(1)基于真实语言应用的翻译研究和开发。本研究有别于传统的基于理论模型的翻译模式。传统的机助翻译研究往往从某个理论模型出发,脱离真实语言应用;理想的模型在真实文本面前往往捉襟见肘。而基于真实语言使用语料的翻译研究则需要多种复杂的技术。
(2)采用基于频数和概率的计算机智能分析方法。语言经常表达的意义、经常使用的语言形式和实现的功能是最核心的内容,是翻译研究的重点,基于频数和概率的方法较为有效地解决有关的翻译问题,而基于规则的传统翻译模式却无法实现。
(3)以语块为基本翻译单位的机助翻译。在真实的语言中,语块是一个具有一定意义的翻译单位,能准确表达其在文本中的含义。基于语块匹配的机助翻译,可以实现最准确的语义翻译状态。传统的机助翻译主要基于单个词,这在文本使用中意义容易发生改变,产生歧义。而目前国外所开发的机助翻译软件一般均以单个句子为翻译单位,翻译过程中出现较为常见的翻译匹配缺失现象。
英汉互译平台及行业专用翻译软件的表现形式的特色和创新体现在如下几个方面:
(1)界面表现形式创新,有助于使用者应用。传统的在线翻译界面或翻译软件主要有两个窗口:文本输入窗口和文本输出窗口。本项目除输入、输出窗口外,开设了基于语料库的具有多重选择的参考语句的窗口,可提供5句(种)具有最适匹配状态的译文语句,供译者选择。该窗口还可实现调用语句所处语料文本的功能,提供语段的语言环境;帮助在输出窗口实现翻译编辑。
(2)建立语料文本的语言质量评价和引用率系统。向译者提供参考语句语言质量评价和使用信息,帮助译者合理地选择翻译的参考语句,提高翻译文本的翻译质量;同时为翻译教学提供一种可评价的依据。在语料选用时即根据语义翻译的要求,按照译文质量确定选用语料的等级(一般为A、B、C三级)。
(3)简便操作系统。为提高翻译者的工作效率,本系统着眼于尽量减少使用者键盘输入的繁琐操作,整个文本的机助翻译过程只需鼠标轻松操作即可。
3 综述
语料库的建设是基于真实语境的,因此,以语料库为基础建立的语言服务平台包含的内容也是基于真实语境的,这将对机助翻译、语言学习、语言测试、语言教学起到良好的促进作用。
参考文献
[1] 贺宏志,陈鹏.语言产业导论[M].北京:首都师范大学出版社,2012.
[2] 傅荣.《欧洲语言共同参考框架:学习、教学、评估》述评[J].国际汉语教学动态与研究,2008(4).
关键词:翻译腔;外宣文本;词汇;句法;篇章
一、引 言
“翻译腔”是翻译实践中的常见病,美国翻译理论家奈达在《翻译理论与实践》一书中称之为“Translationese”(Nida,2004)。在我国,许多学者如范仲英(1999)、余光中(2002)、刘宓庆(1999)、程熙旭(2006)、孙致礼(2003)等对翻译腔做过定义。“翻译腔”又称“翻译体”,是指把原语的语言形式、表达方式、句法结构机械地移植到译语中,因而形成一种不土不洋、不符合译语表达习惯的语言混合体。其主要特征是只顾在形式上逐词逐句地紧扣原文,忽略译语语言结构的特点和习惯表达方式,译文生硬牵强,文笔拙劣,可接受性差(范仲英,1999)。
二、外宣文本的特点
英国翻译理论家和语言学家纽马克把文本类型划分为三类:表达功能型文本、信息功能型文本、呼唤功能型文本。任何文本都可能含有表达、信息和呼唤三种功能(Newmark,2001)。外宣文本注重的是向读者介绍客观事物本身,属于信息功能型文本。纽马克认为信息型文本最好采用语义翻译方法(Semantic translation)进行翻译。语义翻译注重向读者传达与原文语义和句子结构相近的译文(Newmark,2001)。根据纽马克对语义翻译的定义我们可以得知,运用语义翻译时,要保证译文准确传达原文的信息内容,因此外宣文本翻译要确保信息的准确性、真实性、完整性。
三、外宣文本中翻译腔的表现
笔者拟就翻译腔问题从词汇、句法、篇章三个层面进行分析。当然,任何事物都具有双重性,合理的翻译腔在一定程度上承载了一定的异国风情,不失为一种翻译技巧(尹超,2011),应该发扬。本文只就不合理的翻译腔进行分析。
(一)词汇方面
在汉译英中,由于英、汉语的表达方式不同,译者对原作理解不深不透,造成翻译腔现象出现。
1.理解错误,生硬翻译
例1.原文:5号余热房
译文:5 Preheating Furnace
解析:例1中的译文之所以出现翻译腔是因为译者不理解“余热房”的作用,或者将其理解为“预热房”,译为“Preheating Furnace”。“余热”是指在高温生产水泥的过程中剩余的热量,余热房就是收集这些热量进行循环利用。另外,译文对“5号”的翻译也不清晰,我们可以分析一下,译文中的“5”在目标语受众者看来是表示数量词,会理解为这个屋子里有“5个”余热房。可将其改为“No.5 Surplus Heat Furnace”。
2.逐字翻译,表达错误
例2.原文:名称:台式钻床
年代:1958年
译文:Name:Bench Drilling Machi
Years:1958
解析:汉语重意合,英语重形合。“形合”(hypotaxis)指借助语言形式手段(包括词汇手段和形式手段)显示句法关系,实现词语或句子的连接;“意合”(parataxis)指不借助语言形式手段而借助词语或句子的意义或逻辑联系实现它们之间的连接(刘宓庆,2006)。英语属于形合语言,年、月、日的表达要借助介词这一词汇手段显示句法关系,介词没有实际意义,但是不能省略。汉语属于意合语言,年、月、日等时间的表达不需要借助语言形式手段就能明白其中的意义,没有必要加介词。形合注重的是句子成分的完整性,即英语成句必须有主语、谓语和与之相应的其他成分。意合注重的是句子表达的意义是否充分,并不要求主语、谓语齐全。上述例子中,改为“in 1958”是地道的英语表达方式。
3.选词不慎,搭配不当
例3.原文:名称:启新老东门
译文:Name:Chee hsin old east gate
解析:此处“老东门”是指这座门是启新水泥厂以前的东门,意味着现在的东门不是这里,所以“老东门”译为“old east gate”不妥。“old”在《牛津高阶双解词典》(第8版)的英文解释是“having existing or been used for a long time”,但是现在启新水泥厂的东门已经不存在了,用“former”替换“old”意思更准确。
(二)句法层面
在这一层面,由于对英、汉句子结构和成分的差异缺乏必要了解,翻译时生搬硬套,从而影响译本的可接受性。
1.语序照搬,不符逻辑
例4.原文:名称:启新老东门
建于1906年10月,1966年8月被拆毁
复制还原比例:1:2
译文:Name:Chee hsin old east gate
Built in October 1906.August 1966 be broken down.
Copy reduction ration:2-1
解析:对于名称“启新老东门”的翻译已在例3中介绍,此处省略。“建于……被拆毁”此句英译明显照搬汉语语序,不符合英语表达习惯。在汉语意合的地方,英语总是要以各种联接手段将它形合化,不允许留下结构上的“脱漏”(刘宓庆,2006)。根据英语形合的特点,在英语译文中,我们必须把主语加上以达到形合化效果,可将其改为“Built in October 1906,it was broken down in August 1966”,改后主、谓语齐全,是正确的英语表达。
2.语句嗦,不够凝练
例5.原文:启新,跨越三个世纪,历经一百二十余年的发展与变化,创办于积贫积弱的清末民初,成长于风雪飘摇的旧中国,经历了建国后的风云变幻,饱经磨难,几度兴衰,为近代民族工业的发展和国家建设做出了重要贡献,是中国早期水泥工业的缩影。
译文:Originating in the late Qing Dynasty and early Republic China of piled-up poverty and weakness,growing in the precarious old China experiencing great changes after the People Republic of China was established,going up and stepping down several times,contributing to the development of modern,national industry and construction,it is an miniature of early cement industry of China.
解析:原文用排比的句式呈现了启新水泥博物馆的悠久历史,英语译文可采用短句表述。上述译文完全照搬原文语序,片面强调忠实,状语成分过多,不易达到一目了然的效果,与语义翻译方法背离。
(三)篇章层面
1.缺乏对文化差异的认识,造成跨文化交际失败
例6.原文:1891年(光绪17年),细棉土厂厂址选在在大城山南麓(今唐山陶瓷厂院内),占地面积60亩,日产量不足30吨,所用水泥商标为“狮子”牌。
译文:In 1891(the 17th reigning year of Emperor Guangxu),the Cement Plant was situated at the southern foot of Dacheng Mountain(within present Tangshan Ceramic Factory),occupying 60 mu and producing the cement of Shizi brand of less than 30 tons every day.
解析:英语国家与中国的单位表达法不一样,尤其是日常用的长度、面积、重量单位。在汉译英时,需做必要转换,否则读者不能理解数据的具体概念。例11中的面积单位“亩”和重量单位“吨”分别译为“mu”和“ton”不为不妥,但是为了方便英语国家读者理解,最好折合成英语的面积单位“英亩”和重量单位“磅”。
2.内容照搬,片面强调忠实,缺乏灵活性
例7.原文:1892年,唐廷枢病故。江苏后补道张翼继任开平矿务局和细棉土厂总办。
译文:In 1892,Tang Tingshu died of illness.The second-string intendant of Jiangsu Province,Zhang Yi,succeeded him in the official-general of both Kaiping Mining Affairs Bureau and Cement Plant.
解析:文中出现的名字虽然对于中国人可能很熟悉,但是英语国家的读者却很难了解其中的含义。因此,译文要对这些人物进行解释,如唐廷枢可以翻译为:“Tang Tingshu,the former official-general of Kaiping Mining Affairs Bureau during 1870s to 1892”,这样运用英语同位语知识使译文更加完整。
四、克服外宣文本翻译腔的策略
(一)译者应努力提高双语水平,加强英汉对比的学习
翻译腔出现的原因主要是表达问题、片面强调忠实和对原作理解不深不透,因此,加强译者的双语水平对尽量避免翻译腔意义重大。努力提高英汉两种语言的水平,对于克服翻译腔问题有很大帮助。同时,因为英、汉在词汇、句法、篇章等方面有很大差异,为了更好地摆脱原语的语言外壳,将原文意义用符合译语习惯的表达方式展现出来,不仅要加强双语修养,更要加强英汉对比的学习。
(二)学习应用合适的翻译策略及合理的翻译理论指导
从事翻译工作,有必要学习、掌握一些翻译理论、策略及方法。理论来源于实践又对实践起指导性作用,翻译理论不仅指导我们去认识客观规律,更能引导我们能动地掌握和运用翻译的客观规律。在现代语言科学看来,所有的语言规范都只是相对的,因为语言中找不到不受交际环境、语言集团、语言形式(口语或书面语)、语言心理及历时的和共时的语言变异等诸多因素限制的所谓“公认的、不变的标准形式”。在翻译理论中,“规范”虽然也是指某种公认的标准形式,但强调它的相对性、变通性则更有必要(刘宓庆,1999)。所以译者要熟悉一些翻译理论,在从事翻译工作时,选取适当的翻译策略翻译理论做支撑。
(三)养成查译习惯,学会恰当使用翻译工具
奚德通先生曾说过“如果翻译只是拿一些除了自己什么人都看不懂的东西去糊弄那些除了中文什么文都看不懂的人的话,当然可以恣意任性、自‘译’其是,但若真把翻译当作一门严谨的科学,就必须遵守翻译的基本准则,不可自以为是的乱翻一气”(奚德通,2014)。“查译”的传统工具是各种词典,但是词典的更新总是滞后于新词的出现,在翻译时可以结合网络的优势,进行在线查词,“bing”、“google”及“yahoo”都是有利的翻译工具。养成查译的习惯,翻译就会用词准确、地道,尽量避免了“翻译腔”的出现。
五、结 语
翻译腔的实例分析充分证明,造成翻译腔的根本原因是英语和汉语表达方式之间的差异。在翻译的理解过程中,译者难以突破原文表层结构的束缚;在表达过程中,译者将译语与原语过分机械地形式对等。要消除英汉翻译中的翻译腔,只有研读原作,理解原文深层含义,熟悉和掌握英汉民族思维差异以及语言表达差异,使用符合译入语的习惯表达,才能使译文流畅自如,提高译文的可接受性。当然,在努力消除翻译腔的同时,我们也应该辩证地认识到不能不加鉴别地一律否定带有异国风味的译文。总之,我们要坚决消除不符合译入语基本结构规律,破坏译入语语法规范、影响交际的翻译腔。
【参考文献】
[1]Eugene A.Nada and Charles R.Taber,The Theory and Practice of Translation,Shanghai Foreign Language Education Press,2004.
[2]Peter Newmark,Approaches to Translation,Shanghai Foreign Language Education Press,2001.
[3]程熙旭.翻译体与直译[J].语文月刊,语文学刊,2006(15)
[4]范仲英.使用翻译教程[M].外语教学与研究出版社,1999
[5]刘宓庆.当代翻译理论[M].中国对外翻译出版公司,1999
[6]刘宓庆.新编汉英对比与翻译[M].中国对外翻译出版公司,2006
[7]孙致礼.新编英汉翻译教程[M].上海外语教育出版社,2003
[8]奚德通.有些翻译不能“翻”只能“查”[J].翻译教学与研究,2014(04)
关键词:
中图分类号: TP391.3 文献标识码:B 文章编号:2095-2163(2011)01-0051-05
0引言
词语相似度计算[1-2]研究的是采用怎样的方法来计算或比较两个词语的相似性。词语相似度计算在智能检索、文本聚类、文本分类、自动应答、机器翻译等领域都有广泛的应用。在不同的应用中,词语相似度有不同的用途,例如,在基于实例的机器翻译中,词语相似度能够表示文本中两个词语的可替换程度;在信息检索中,利用词语相似度能够提升信息检索的准确率和召回率;在问答系统中,答案和问句的符合程度可以通过计算两者含有词语之间的相似度来衡量。本文将研究词语相似度计算在英文辅助写作系统中的应用。
1英文辅助写作系统
英文辅助写作系统是一个英汉双语的例句检索系统,用户可以使用中英文双语检索自然语言处理领域英文论文中的地道例句,同时获得例句所属论文的相关信息(作者信息、论文题目、论文的来源),为写作英文学术论文的用户提供帮助。用户可以输入想要表达的中英文词组和短句,系统会为用户查找与输入相似的自然语言处理领域的文章中的地道的英文例句,用户可以通过观察和学习检索到的例句,组合出地道的、满足需要的英文表达。该英文辅助写作系统主要功能如下:
(1)英文短语搭配推荐生成
主要针对两个词的query输入,给出语义相似的搭配推荐。用户可以比较推荐的搭配和输入,选择出更地道的英文表达。系统短语搭配参考结果页面如图1所示。
(2)翻译推荐生成
建立中译英的统计机器翻译系统,其中语言模型的语料选用的是ACL Anthology抽取的共1716418句的语料,可以体现出更地道的英文表达。翻译模型的语料采用的是CNKI的摘要,这是个大规模的双语平行语料。对用户的每个中文查询词,后台的在线机器翻译系统进行翻译,返回前十的nbest的结果,以供用户选择。同时用户输入的中文query后返回的英文检索结果是按照评分最高的翻译进行检索获得的结果。系统翻译候选结果页面如图2所示。
(3)同义词推荐和单个输入的搭配推荐
① 同义词推荐:利用WordNet生成单个词query的同义词推荐,包括其可能的四种词性的同义词推荐,分别为名词的、动词的、形容词的和副词的。
② 单个输入的短语搭配推荐
与(1)的短语搭配参考类似,只是需要其短语搭配生成的步骤。这里短语搭配推荐可能有很多,不便于在页面全部显示,所以按照其在检索库中的精确匹配次数进行排序,只取前五个搭配在页面显示。同义词和短语搭配推荐的结果均按照其在检索库中的精确匹配次数排序后以降序的顺序显示。系统单个输入的同义词推荐和常用搭配推荐结果页面如图3所示。
(4)例句检索库:检索的语料来源于ACL Anthology[3]从1979年至今的所有论文中有相关信息(题目、作者等)的文章的句子。文章总数8 173篇,总句子规模有1 716 418句。语料库特点是句子都是地道的英文表达。
用户在实际使用该系统时,输入的检索词往往不能准确地检索到所需的例句,因为用户初始是不知道地道的英文表达的,这就导致用户可能需要进行多次检索,才能检索到最理想的例句,也可能一直检索不到,这将影响到用户使用的满意度。因此,需要给用户提供查询的相关词提示功能,帮助用户更快更好地使用该系统。该检索系统的相关词提示功能有多种,包括同义词推荐,两个词相似搭配推荐、单个词常用搭配推荐等等。笔者在本文中主要研究在该系统背景下的同义词推荐生成方法。
在该检索系统的实际运行过程中,发现用户在使用同义词推荐功能时,主要关注同义词推荐的第一个词是否是在自然语言处理领域中与查询词最相似的词。考虑到这一用户需求,首先利用语义词典WordNet生成通用领域的同义词候选集,然后进行特定语境环境下的词语相似度计算,对同义词候选集进行排序,为用户提供高质量的同义词推荐功能。
2相关研究
2.1WordNet
英文WordNet[4]是普林斯顿大学认知科学实验室开发的一部在线词典数据库系统,是基于英文的词汇语义网络系统。WordNet本质上是一个词汇概念网络,描述的是概念间的各种语义关系,WordNet中也规定了动词、形容词和副词的语义知识表示规范,其核心都是synset(同义词集合)以及概念之间的各种关系。
2.2词语相似度研究现状
国内外对词语语义相似度的计算方法大体可分为两类:基于统计的词语语义相似度计算方法[5-6]和基于语义词典的词语相似度计算方法[7-9]。
基于统计的词语语义相似度计算方法是经验主义方法,是把词语相似度的研究建立在可观察的语言事实上,而不仅仅依赖于语言学家的直觉。这种计算方法是建立在两个词语语义相似当且仅当这两个词语语义处于相似的上下文环境中这一假设的基础上,通过利用大规模语料库,将词语的上下文信息作为语义相似度计算的参照依据。
基于语义词典的词语相似度计算方法是基于语言学的理性主义方法,是利用语义词典,依据概念之间的上下位关系和同义关系,通过计算两个概念在树状概念层次体系中的距离来得到词语间的相似度。
3同义词推荐的生成方法
首先通过语义词典WordNet生成用户查询词在通用环境下的同义词候选集,然后利用基于上下文向量的特定语境下的相似度计算方法,计算同义词候选集中每个词与目标词在自然语言处理领域语境下的相似度值,最后将同义词候选集按照相似度值以降序关系排列显示给用户。
3.1同义词候选集生成
WordNet是一个英语词汇及其词法关系的数据库,同时也是一个英语词典。由于WordNet包含了语义信息,所以有别于通常意义上的字典。WordNet根据词条的意义将其分组,每一个具有相同意义的字条组称为一个synset(同义词集合)。WordNet为每一个synset提供了简短、概要的定义,并记录不同synset之间的语义关系。WordNet的开发有两个目的:其既是一个字典,又是一个辞典,但比单纯的辞典或字典都更加易于使用,而且支持自动的文本分析以及人工智能应用。PyWordNet通过一些专门的工具方法将WordNet数据公开为一组 Python 数据结构。PyWordNet 被组织成四个词典,分别对应 WordNet 2.0 的四个部分――名词、动词、形容词和副词。词汇的单词形式是主键,每个记录都包括含义(sense)、同义词组(synonym set)、注释(glosse)和指针(pointer)。
本文通过pyWordNet提供的接口访问WordNet数据库,从而获得用户查询词的同义词候选集列表。此时获得的同义词候选集列表是通用环境下的同义词,而且被认为与查询词的相似度都是相同的。但在特定语境环境下,这些同义词与查询词的相似度会出现不同,考虑到在向用户推荐时,需要把与目标词相似度最高的词排在最前以供用户优先选择,因而需要计算这个同义词集在特定语境环境下与目标词的相似程度。
3.2特定语境环境下的相似度计算方法
3.2.1上下文词语同现向量(CWCV)
特定语境环境下语义相似度计算方法建立在两个词语语义相似当且仅当这两个词语语义处于相似的上下文环境中这一假设的基础上。为了计算两个词语之间的语义相似度,需要从语料中统计词语的上下文信息。在本文中,为每一个需要计算语义相似度的词语构造上下文词语同现向量(CWCV)。
CWCV的定义:一个词语的上下文环境中含有丰富的有关该词的语义信息,在不同的上下文中一个词语往往具有不同的语义,因而可以用在上下文环境中与目标词以某种关系同现的、所有词语构成的向量来表示目标词语,这个向量就是CWCV。
3.2.2词上下文向量的生成
(1)通过简单的浅层句法分析,将训练集中所有文本的每一个句子都分解为若干个句法组,删除不太重要的句法组后,标记其中的核心词和修饰词。
(2)以一个关键词为中心,以句子为共现单位,通过对训练集内该词语的上下文词语进行统计,得出该词语的词上下文向量。用同样的方法得到其它关键词的词上下文向量。
利用上述方法生成的词上下文向量矩阵为:TCV [i] [j] =?邀Cij?妖,其中,i和j的取值范围为[1.. n],Cij为小于1的实数,表示第i个词语ti与第j个词语tj之间的上下文关系;第i行的值集合(Ci1,Ci2,…,Cin)即为第i个词语ti的词上下文向量,表示训练集中的n-1个词语与ti之间的上下文关系,可以看作是ti在训练集中的语义描述。
词上下文向量生成算法的主要步骤如下:
步骤1:用浅层句法分析工具将训练集中所有文本的所有句子都分解为句法组,只保留名词句法组和动词句法组,每个保留下来的句法组内进一步删除名词、动词、形容词之外的其它类型的词语,并区分出其中的核心词和若干个修饰词。
步骤2:设置并初始化词上下文向量矩阵TCV[n] [n]。
步骤3:生成矩阵,具体算法为:
for(i=0;i<训练集中的句子总数;i++)
for(j=0;j<句子中的词语个数;j++)
?邀
wij=第i个句子中的第j个词语;wik=第i个句子中的第k个词语;
if(wij和wik位于同一组且具有修饰关系或位于不同的句法组但都是核心词)
R=1; else R=α;
noij=wij在向量空间特征集中的序号;noik=wik在向量空间特征集中的序号;
TCV[noij][noik]=TCV[noij][noik]+R;
?妖
步骤4:对TCV中每一个不为空的向量都进行规格化。
3.2.3基于词上下文向量的词语相似度计算
在上述词上下文向量矩阵的基础上计算任意两个词语之间的相似度,具体方法是:给定两个词语,从词上下文向量矩阵中分别提取各自对应的词上下文向量,直接计算这两个向量之间的余弦系数并将其作为词语之间的相似度值,计算结果保存到相似度矩阵中。词语相似度矩阵Sim的计算公式如下:
其中,Sim为下三角矩阵,i≥j,TCV[i]、TCV[j]分别为词语ti和tj的词上下文向量,Sim[i][j]为词语ti和tj之间的相似度,TCV[i][k]、TCV[j][k]分别为词语ti和tj的词上下文向量第k维的权值。
4系统相关实验
由于词语相似度是一个主观性很强的概念,现在还没有一个合适的词语相似度计算测试集,所以在本课题中的测试集来源于ACL Anthology随机选取的100个单词。文中通过人工观察的方法对这100个单词的同义词集相对于查询词进行排序,将该排序结果设定为参考排序,然后与系统排序进行比较。由于人工观察的方法主观性太强,同时用户在使用时主要关注与查询词最相似的词是否排在第一位,所以设定当人工观察排序结果中最相似词排在系统排序中的第一位且系统排序与人工排序最多有一个顺序不一致时,认为系统排序结果基本正确,并记录这100个单词的人工判定的最相似词在系统排序结果中的位置。
这里设定的baseline方法是只使用WordNet产生的同义词获选集的方法。
文中采用以下指标对算法进行评价:
(1)准确率(precision)的评测公式如下:
其中,N■表示的是测试的单词总数,当人工观察的最相似词排在系统排序中的第一位且系统排序与人工排序最多有一个顺序不一致,此时认为系统排序结果正确。Ncorrect为系统排序结果判定为正确的个数。
(2)排序倒数(Reciprocal Ranking,RR)是算法返回结果中正确结果出现位置的倒数,平均排序倒数是多次计算的RR的结果的平均值,利用如下公式:
其中,N表示测试单词总数,ni表示对于第i个查询单词的人工判定的最相似词在系统排序结果中位置ni。
(3)查询输入在例句检索系统中精确匹配次数可以直接反映该输入在自然语言处理中常见程度。例如,单词“show”在该例句检索系统中精确匹配的次数是14 539,而单词“give”在该例句检索系统中精确匹配的次数是6 625。第一个词明显比第二个词在自然语言处理领域中更常见。因此可以自动地通过精确匹配次数来评价同义词候选集中的每个词的常见程度。由于用户主要关注同义词推荐的第一词,所以分别记录测试集中每个词的同义词推荐在使用本文方法的排序和使用baseline方法的排序中第一个词的精确匹配次数A和B,然后两两进行比较:当A>B时,本文方法的个数增加1;当B>A时,baseline方法的个数增加1;当A=B时,本文方法和baseline方法个数不变。最后计算这两种方法的获胜比例。暂称该方法为C评价方法。实验结果如表1所示。
通过表1的准确率可以看出,本文的方法相比于baseline方法可以很好地选择出查询词的最相似词。通过MRR值可以看出,本文的方法相比于baseline方法可以对相似词语与查询词的相似程度给出一个合理的排序,即可以给检索系统提供一个准确的待扩展词的相似度排序。通过C评价方法,发现在100个测试词中,本文方法的获胜比例为44%,而baseline的方法的获胜比例只有16%,这说明本文方法产生的同义词推荐中与目标词最相似词的常见程度远大于baseline的方法。
在ACL Anthology语境下的相似度排序举例说明,对查询词cite的动词形态在WordNet的相似度和本文相似度如表2所示。
单词cite的通用环境下的同义词为refer、name、mentio- n、advert,在WordNet的相似度计算下,其相似度均为1.0,不能区分出与目标词 cite 的最相似词和获得相似程度的排序。而本文相似度在这里得到了较好的效果,单词refer在该语境下是与单词cite最相似的词,大量观察下这符合ACLAnthology使用情况。同时观察出单词advert在ACL Anthology没有出现,这说明在通用领域下的同义词可能在特定语境环境下与目标词完全不相似,两者不可替换。
5结束语
词语相似度计算在自然语言处理、智能检索、文本聚类、文本分类、自动应答、词义排歧和机器翻译等领域都有着重要的应用价值。本文将词语相似度计算的知识应用到英文辅助写作系统中,结合了语义词典WordNet和基于上下文的特定语境环境下的相似度计算的方法生成有序的同义词推荐。本文的方法在准确率、MRR以及本文设定的C评价这三个指标上远优于只使用WordNet的方法,同时本文的方法在准确率的评价中达到73%,基本满足用户的需求。
参考文献:
[1] TURNEY P D. Similarity of Semantic Relations[J]. Computation- al Linguistics Journal,2006,32(3):379-416.
[2] 秦春秀,赵捧未,刘怀亮. 词语相似度计算研究[J]. 信息系统,2007,30(1):105-108.
[3] http://aclweb.org/anthology-new/.
[4] 普林斯顿大学认知科学实验室. WordNet[EB/OL]. http://wordnet. princeton.edu/.
[5] BROWN P,PIETRA S D,PIETRA V D, et al. Word sense dis- ambiguation using statistical methods[C]// Proceedings of the 29th Meeting of the Association for Computational Linguistics(ACL-9 1),Berkley,C.A.,1991:264-270.
[6] DAGAN I,LEE L. Similarity-based models of word cooccurrence probabilities [J]. Machine Learning. Special Issue on Machine L- earning and Natural Language,1999.
[7] 刘群,李素建. 基于《知网》的词语语义相似度计算[J]. Comput- ational Linguistics and Chinese Language Processing,2002,7(2): 59-76.