开篇:润墨网以专业的文秘视角,为您筛选了一篇机器翻译VS人工翻译范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
在国际交流和科研教育等领域,人们需要对异国语言文字进行翻译,过去这是语言大师施展才华的舞台,随着硬件技术飞速发展、软件技术不断完善以及语言研究的不断深入,机器翻译得到越来越广泛的应用。如果有一天你参加一个大型会议,发现那里的同声翻译竟然是一个机器人,你是否会后悔自己花了十年时间去学习另一种语言呢?为了让这一天早日到来,让我们现在就开始了解机器翻译系统的原理及其采用的技术,并展望其未来的发展和应用。
机器翻译的原理――人工智能
与电子双语辞典和翻译记忆产品不同,机器翻译使用人工智能来实现对源语句的复杂分析,并构建尽可能完善的翻译。目前已形成商业化产品的主要类型有基于转换的机器翻译和数据驱动型机器翻译,其他的机器翻译类型还有简单的基于词典的机器翻译、中间语机器翻译和混合系统。
基于转换的机器翻译
基于转换的机器翻译又称基于规则的机器翻译,它是从五十年代开始发展起来的,目前大多数的企业和商业机器翻译属于此类型,实现方式如下:
分析源语言句段。系统首先查看辞典并对源语言句型进行句法分析,即将句子分解为几个部分,如主语、谓语或宾语等。它采取分解的方式而不是根据词汇直接转换,以保证句子的前后关系,并符合翻译目标语言的语法规则。
映射语法结构到目标语言语法并产生目标语言句子。根据转换规则重新排列词语,或调整句子结构使之符合翻译目标语言的语法规则,使其最终翻译结果符合目标用户的使用习惯。如果规则尚未建立,句子模式就无法获得正确分析。
数据驱动型机器翻译
数据驱动型机器翻译可通过两种不同的方式来实现,即统计机器翻译(Statistical Machine Translation,SMT)或基于翻译实例的机器翻译(Example-Based Machine Translation,EBMT)。这两种方法都是使用语料库作为翻译知识的来源,基于系统已有的翻译样例,分析源句子和目标句子对,计算每个源句子片段与目标句子片段的匹配度,查找出与源句子词汇和表达最匹配的目标句子片段。由于句子片段可以是从单个词语到整个句段的任何部分,系统相应地自动建立辞典和翻译。
基于统计的机器翻译方法源于把机器翻译看成是一个信息传输的过程,即把翻译看成是一种解码的过程。
基于翻译实例的机器翻译系统中知识以翻译实例和语义词典等形式存在,对于实例库中已有的文本,可以直接获得高质量的翻译结果;对与实例库中存在的实例相似的文本,通过类比推理,并对翻译结果进行少量的修改,构造近似的翻译结果。
基于翻译实例的机器翻译避免了一些传统的基于规则机器翻译必须进行的深层次语言学分析。只要记忆库中存在外形同输入相似的句子,就可以进行匹配,容易产生高质量的译文,尤其是利用了较大的翻译实例库,或者输入能和实例精确匹配时更是如此。
数据驱动型机器翻译系统的出现,使机器翻译不需要经过句型分析和转换规则处理,就能直接获得翻译结果。因此近年来一直是机器翻译的研究的热点之一。
混合系统
为综合各个机器翻译方式的优势和不足,以生成更好的翻译结果,人们开始将基于规则的语法分析和基于数据驱动转换规则的功能集成到一起,或者将基于样例的系统和标准的统计方法集成在一起进行研究,于是混合系统成为当前的另一个机器翻译研究热点。如德国的Verbmobil系统,就是涉及三种语言(德语、英语、日语)的双向语音机器翻译系统。该系统将基于统计的翻译方法(Statistical Translation)和基于样例的翻译方法(Case-Based Translation)结合到一起,语音处理领域和自然语言处理领域中的各种技术几乎都在这个系统中有所反映。Verbmobil在大规模翻译实验中,正确翻译率达到大约80%,在真实用户的端对端测试中,90%的对话任务获得成功。
机器翻译vs电子辞典
机器翻译系统可以为任何类型的句段自动建立翻译,而不受存储在翻译记忆数据库中的已有句段所限制。大多数的机器翻译系统能根据句子的上下文提供相应的词和句段的翻译,而不仅仅是逐字翻译。相比而言,其他的计算机翻译工具如电子双语词典,只能对单词或短语提供自动化翻译,它无法根据给定语境来选择翻译,也不能处理整个句段,而对于连续的文章,这种逐字翻译往往是无效的。
翻译记忆产品是许多翻译机构常用的翻译工具,它能够为词、句子甚至段落提供自动化翻译。但它要求源文件内容与已存储在翻译记忆数据库中的目标句段具有一定程度的匹配。如果源句段与目标句段相匹配,那么能获得相应的翻译结果,否则就无法获得相应的翻译。翻译记忆可以避免人们在同一文档或不同文档中的相同句子的重复翻译。但人们往往习惯于用不同的方式表达相同的事情,而翻译记忆对于那些在翻译记忆库中无法找到相匹配的句段文字,无法提供翻译。
机器翻译能灵活处理任何需要翻译的句段文字,但其翻译质量除了取决于机器翻译系统已有的语法规则以及系统辞典以外,还依懒于源语言的书写质量,如表达清晰、句子结构简单等。
与传统的使用翻译人员进行人工翻译相比,机器翻译具有以下优势:
首先,机器翻译降低翻译成本。虽然当翻译量较小时,由于需要支付系统实施成本,机器翻译所带来的成本下降并不显著,甚至可能会比人工翻译要高。但如果人工翻译成本超出机器翻译系统的安装成本,机器翻译将能降低翻译成本,而且随着翻译工作量的不断增加,机器翻译的成本将远远低于其人工翻译成本。
其次,机器翻译能缩短交付时间。采用机器翻译系统作为计算机辅助翻译的工具,其翻译交付时间取决于后编辑所需花费的时间,而对于很多不需要进行后编辑的翻译工作产品,可立即交付。
第三,机器翻译能随时提供翻译。翻译人员的资源是有限的,一个翻译项目过来,往往需要花费一定的时间来调配和获得相应的人力资源。而机器翻译系统可以随时进行而无需等候。
第四,与人工翻译相比,采用机器翻译能更好地保持不同文件以及同一文件不同部分上下文的一致性。而人工翻译,除非经过专门培训并进行相应的管理机制,才可能保持上下文的一致性和准确性。另外,利用机器翻译可以省去调配翻译人员到位,分发工作给相关的人员,收集、比较和检查翻译作品,对术语进行一致性处理等的工作过程,简化了翻译工作流程,并能更有效地对翻译生产量进行评估。
但是,由于机器翻译不可能提供百分之一百准确的翻译,它不可能在所有的翻译领域完全替代翻译专家的工作。
机器翻译的应用领域
当我们分析翻译活动的需求和目的时,我们可以发现,有的翻译需求要求翻译结果非常好,即要求翻译结果百分之一百准确;但有的翻译需求对翻译质量要求稍微低一些,用户只是想了解其基本内容,而且常常是越快越好,而这种需求应该可以利用机器翻译来完成。目前的机器翻译技术除了可以支持文本文件或支持从机器翻译用户界面输入文字外,还能支持HTML和Microsoft Word文件格式;如果有其他类型的文件格式需要翻译,也可以通过过滤器将其内容和表现形式(如粗体、斜体等)分离后,再进行翻译。如果借用其他工具对光学字符或语音进行识别,机器翻译还可以对语音或打印材料进行翻译。所以,机器翻译可以应用于以下领域:
了解信息概况
利用机器翻译,使读者对源文字信息有大致的了解。例如,当用户需要了解源文件的大致内容以帮助其决策是否提供该文件的翻译出版物时,可以由机器翻译来满足该需求。
常用信息的访问和
对于一些具有重复性却有效期较短的信息,如股票价格,天气预报以及财务信息等,可以使用机器翻译来完成。如,加拿大政府利用机器翻译系统,将天气报告内容从英语自动翻译为法语。
信息交流
翻译系统可以为电子邮件以及其他人与人之间的交流提供快速翻译。如聊天、即时信息和短信服务等。目前在国外已有一些公司,利用机器翻译处理人际间的交流,并为其用户带来了可观的利益。如果在系统服务器上配置相应的安全服务,用户的安全和隐私问题可以得到更好保障。
语音翻译
机器翻译可替代翻译人员做一些日常交流的翻译,从而使翻译人员专注于进行更重要事务的处理。如宾馆、医院登记处,信息站,旅游景点等那些不需要由翻译人员来进行高质量翻译的场所,可以由机器翻译来处理。
目前已有一些机器翻译系统应用于翻译机构、Internet网站、从事多语言市场和劳务的公司。如翻译机构使用Trados、SDL等机器翻译产品为翻译专家提供翻译草稿,以提高翻译速度和翻译的一致性。网站如金桥翻译中心/使用机器翻译系统为网络用户提供即时翻译,为浏览者提供方便。还将会有越来越多的企业和机构使用机器翻译辅助其进行国际间的交流。