开篇:润墨网以专业的文秘视角,为您筛选了一篇基于英汉平行语料库语义分析的翻译教学系统设计与应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
摘要:本文尝试把英汉平行语料库语义分析引入翻译教学中。通过对语料库不同层次的标注,包括语法标注、浅层语义标注和深层语义标注,设计相应的英汉翻译教学系统,并通过在实际教学中运用比较系统的教学效果,改进教学系统。为了推广该系统的应用,该系统也可以部署在Internet上,采用基于B/S(浏览器/服务器)结构,便于系统维护和用户使用。
目前基于语料库进行语言研究和翻译研究都取得了一定的成果。特别是语料库方面,国外当代语料库有共建英语语料库(COBUILD)、朗文语料库(LANGMAN)、英语国家语料库(BNC)以及国际英语语料库(ICE)为代表的超级语料库(mega-corpora),它们的容量更大,收词量大都上亿,覆盖面更宽,应用更广。东北大学自然语言处理实验室的NiuTrans是目前国内唯一一套开源的统计翻译系统,该系统提供了英汉平行语料库,但是只进行语法标注,没有进行语义标注。对于科学研究和教学应用,可以对该语料库进行深加工,标注浅层和深层语义信息,这样可以应用在教学中。
以上所有研究都是基于经过语法和浅层语义标注的基础上的平行语料库进行的。由于缺少对语料库进行深层语义分析,给研究和应用带来了局限性。
一、现有语义分析工具
对选取的语料进行语法、语义标注,由于目前对语料库的语法标注技术已经成熟,可以运用相应的软件来进行,可以利用斯坦福大学的NLP小组的Parser来进行英语和汉语句子的语法标注,然后对语料进行英语语义和汉语语义分析。
运用英语语义分析网上资源WordNet、FrameNet和VerbNet进行英语深层语义标注,即语义框架识别和标注。由于目前汉语还没有相应的WordNet、FrameNet和VerbNet网上语义分析资源,通过查找汉语对应词语得到相应的已经标注好的英语句子,通过英语句子的语义框架来标注汉语句子的语义框架,最后由人工来校对、编辑。
在汉语语料库语言学研究中,基于词的研究取得了令人满意的成果,如哈尔滨工业大学的开放自然语言平台(Language Technology Platform,LTP)。LTP制定了基于XML的语言处理结果表示方法,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块,其中包括分词(CRFWordSeg)、词性标注(POSTagging)、命名实体识别(NER)、依存句法分析(GParser)、词义消歧(WSD)和语义角色标注(SRL)六项中文处理核心技术以及基于动态链接库(Dynamic Link Library, DLL)的应用程序接口、可视化工具,并且能够以网络服务(Web Service)的形式进行使用。
二、 语料库语义分析在教学中的应用
传统翻译教学以教师为中心,无法很好调动学生的积极性。借助语料库进行翻译教学,学生通过探索式、发现式和“做中学”的活动,发现、总结和归纳语言运用的特征和规律,有利于培养学生解决问题的能力和学习能力。
把语料库技术引入翻译教学中,对于培养学生的自主学习能力、提高学生学习兴趣有很大的帮助。对教育信息化是一个有益的尝试。
三、 系统实现技术
本系统拟采用基于Internet网络的B/S结构来实现。用户通过各种浏览器使用该系统,不需要在本机上安装任何插件,这样方便用户使用。服务器端使用Apache或者Nginx作为网络服务器,使用Python语言、MySQL数据库实现系统功能。语料库可使用现有的语料库,也可以用网络爬虫从网络获取我们需要的数据,组成语料库。用WordNet、VerbNet和FrameNet进行语义分析,最后用MySQL进行数据管理,包括建立数据库、查询、备份和更新。Python语言具有丰富的自然语言处理工具,并且具有Web编程能力。所有工具都能够从网络上免费获得,不涉及版权问题。
由于目前对汉语语料库进行深层语义分析还处于探索阶段,本课题通过平行语料库汉语词语所对应的英语句子的语法信息、浅层语义信息和深层语义信息,来进行汉语深层语义标注,是一个创新。
参考文献:
[1]王克非.双语平行语料库在翻译教学上的用途[J]. 外语电化教学,2004(06).
[2]秦洪武,王克非.对应语料库在翻译教学中的应用:理论依据和实施原则[J]. 中国翻译,2007(05).
作者简介:卢美华,北京农业职业学院副教授,研究方向:计算机自然语言处理,包括语料库、机器翻译和相关程序设计。