行业资讯

建设军事翻译所需翻译技术与语言资源

文章来源:专业翻译公司 发布时间:2018-03-28 17:46点击次数:

  翻译技术指应用于翻译活动的各类信息化技术。学界对翻译技术内涵的界定有广义和狭义之分。广义分类的代表是Alica(2008:96-99)的划分:1)译者的计算机设备:实现计算机普遍功能所需的设备;信息交流与检索工具:译者通过计算机和网络与客户、其他译者、专家交流的工具和资源;文本编辑和桌面出版工具:用于文本写作、更正和修订的工具;语言工具和资源:语言工具是指用于收集和管理语言数据的工具,如Multiterm和WordSmith。语言资源主要有电子工具书、数据库和文本语料库;翻译工具:与语言转换过程直接相关的翻译辅助工具,包括翻译记忆系统、术语库、机器翻译软件。对翻译技术狭义理解是翻译专用的技术工具,LISA(2007:37-40)列出了5类重要的语言技术:术语管理系统、翻译记忆系统、机器翻译工具、本地化工作平台和全球化内容管理系统。在翻译技术中处于核心位置的是翻译记忆系统、术语库工具和机器翻译工具:

  1)翻译记忆系统。翻译记忆系统(translation memory system,又称translation memory tools/managers)是基于翻译记忆(translation memory, TM)开发的计算机辅助翻译软件。翻译记忆是储存原文本和译文本对应的语段(segment)的数据库。“语段是一种文本要素,被认为是最小的可翻译单元,由句号、分号或硬回车定义。通常是句子,也可以是标题或列表中的项目”。市场份额较大的翻译记忆系统有SDL Trados、Déjà vu、和Wordfast等,其工作原理是:译者在创建翻译项目时为项目挂载翻译记忆库。在翻译过程中,系统自动搜索存储在翻译记忆库中相同或相似的双语翻译对(translation unit),给出参考译文,这样先前完成的翻译就可以为译者提供参考,节省译者的劳动。随着翻译进行,完成的双语记忆对不断存入翻译记忆库,扩大记忆量。

  2)术语库工具。术语(terminology)是指在特定学科领域用来表示概念称谓的集合,通过语音或文字表达或限定科学概念的约定性符号,是保证有效思想和认识交流的工具。术语库(terminology database)是以设定的信息存储方式储存,包含有多语种术语对照表和定义、语境、词性、词源、同义词等附加信息的术语数据库。市面主流的翻译记忆系统通常包含了术语功能模块,如SDL Trados的Multiterm组件。使用翻译记忆系统进行翻译时,可以同时调用翻译记忆库和术语库。在多人协作的翻译项目中,不同译者可以使用同一个术语库,译者遵照术语库给出的译文翻译术语,既可大幅度节省查找术语的时间,也可以在多人协作的项目中保证术语统一。术语库需要通过专门的流程维护和更新,维护术语库是译者重要的工作内容。

  3)机器翻译系统。机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。机器翻译技术的研发始于1949年,但在汉英语言对上一直缺乏令人满意的商用成果。自2014年以来,端到端神经机器翻译获得了迅速发展,相对于统计机器翻译而言在翻译质量上获得显著提升。由于机器翻译准确率的提升,人们开始尝试由“机器辅助人工翻译”(machine-aided human translation)转向“人工辅助机器翻译”(human-aided machine translation)。在语言服务行业内,已经开始尝试“MT+PE”(机器翻译+译后编辑)工作模式,更大程度地用机器翻译替代译者劳动,节省成本并大幅提高单位时间内的翻译产出。

  语言资源支撑着语言工具的开发和使用。欧洲语言资源学会(ELRA)对语言资源定义是“由语音或语言数据和数据描述组成的机器可读数据集,用于创建、改进或评价自然语言和语音算法或系统,或作为核心资源用于语言服务行业、本地化、语言研究和领域研究。语言资源包括但不局限于口语和书面语语料库、术语库和电子词典”。ELRA进行语言资源建设的主要目的是支持自然语言技术的开发。崔启亮归纳了语言服务企业的六种语言资产:翻译记忆库、术语库、项目案例库、语言知识库、技术写作规范和翻译风格规范,这些语言资产广泛运用于产品的设计、本地化及翻译过程之中。与翻译直接相关的语言资源有三种:翻译记忆库、术语库和双语平行语料库。翻译技术工具的使用离不开这些语言资源。翻译记忆系统是基于翻译语料的重复利用这一理念开发的,其发挥作用的前提是具有前期积累的翻译记忆库,翻译记忆库的库容越大、质量越高,就越能为译者提供高质量参考译文,越多地节省译者劳动。术语库工具在翻译的过程中也需要调用已经建好的术语库,才能为译者翻译术语提供参考。机器翻译系统的训练也需要大容量高水平的双语平行语料。


分享到: 更多
------分隔线----------------------------