机器翻译因其高效的翻译速度和低成本(个人使用机器翻译引擎基本免费)广受欢迎,越来越多的客户对机器翻译+译后编辑——也就是通称“MTPE”的形式产生了兴趣。那么,什么样的需求适合MTPE呢?各大翻译引擎各有什么特点呢?为了研究这个问题,我们用市场上常见的“百度翻译”“有道翻译”和最近越发显露头角的“DeepL翻译引擎”翻译同一段文本并进行译后编辑,然后各自评价了分数。

1. 译后编辑(Post Editing)是机器翻译的有效补充

不过虽然机器翻译有比如时效性、低成本、操作简单便捷等等的优点,但并不一定适合所有翻译场景。在某些情况下可能翻译出的结果会有些不尽如人意。而为了让机器翻译结果能更顺应客户需求,应运而生的就是机器翻译的译后编辑——俗称“机翻人改”,简称“MTPE”的服务。MTPE服务会修改机器翻译结果不如人意的地方,让机器翻译的结果尽量贴近客户需求。下面就来具体讲一讲。

2. 具体说明何为机器翻译,何为译后编辑

机器翻译的译后编辑,英语写成Machine Translation Post-Editing,略作MTPE。其中译后编辑( Post-Editing)如文字意义,就是指机器翻译后的人工编辑、校正。机器翻译,是指使用人工智能翻译引擎处理自然语言之间的翻译工作。使用方法非常简单,只要用户将原文输入到网站或者软件的指定位置,然后选择原文和译文的语言,按下翻译按钮就可以了。现在市面上的大部分翻译引擎,如百度、有道、DeepL并不限制免费用户的一般性使用。但支付相应费用就能使用比如文档翻译等更高级的功能。

过去,机器翻译还会给人一种误差颇大的印象。然而随着神经网络技术和深度学习的发展,机器翻译的质量也在发生着变化。机器翻译引擎学习的语料越多、所翻译的原文结构越接近标准语法,机器翻译的质量也会越发的精确自然。不过反过来说,在实际应用中,我们翻译的内容不一定是机器翻译引擎曾经学习过的,用词、语法也不一定非常规则,这时候机器翻译发生错误就在所难免。为了弥补机器翻译的短处,应运而生的服务就是“译后编辑”。

译后编辑,就是人类译者确认机器翻译的译文,修改如漏译、用语错译、句子结构错误、用词不统一等原则性错误,有时候还会按照文化背景和专门知识对翻译不到位、含义偏差等进行调整。也就是说,对机器翻译的译文,以人类的视角做出调整,让译文更加正确自然,这就是译后编辑的工作。机器翻译和译后编辑,两者合在一起,通常被称作“机翻人改”,非常直观。

3. 百度、有道、DeepL翻译结果比较

日文原文: 脳内「ごみ屋敷」に?スマホ依存がもたらす“脳過労” いつでもどこでもインターネットとつながるスマートフォンなどのデジタル端末。それらとあえて距離を置いて生活する「デジタルデトックス(解毒)」が注目されている。デジタル機器は使い過ぎると脳が疲労し、物忘れや無気力などの症状を引き起こす危険性が指摘される。たまにはスマホを放り出し、脳を休めてみませんか。

百度: 脑内“垃圾屋”?智能手机依赖带来的“脑疲劳” 无论何时何地都能连接互联网的智能手机等数字终端。与它们保持距离生活的“数字排毒”备受关注。有人指出,过度使用数码设备会导致大脑疲劳,有可能引起健忘、乏力等症状。偶尔把手机扔出去,让大脑休息一下怎么样。

有道: 脑内变成“垃圾屋”?依赖手机带来的“大脑过度疲劳” 随时随地都能与互联网连接的智能手机等数字终端。与这些人群保持距离的“数码排毒(解毒)”备受关注。过度使用数码设备会使大脑疲劳,引发健忘症和乏力等症状。偶尔放下手机,让大脑休息一下吧。

DeepL: “大脑 垃圾场”? 智能手机依赖造成的 大脑过劳。 智能手机和其他数字设备随时随地都能与互联网相连。 数字排毒”,一种远离这些设备的生活方式,正在引起人们的关注。 有专家指出,过度使用数字设备会使大脑疲劳,并导致记忆力下降和昏昏欲睡等症状。 为什么不偶尔放开你的智能手机,让你的大脑休息一下?

以上就是翻译结果。可以看出,三个翻译引擎各有千秋,其中DeepL在翻译长句子的时候会做出一些位置的调整,让语句看起来更加自然。而百度和有道的翻译在标点符号上符合中文的用法。

4. 机器翻译的优势和不尽如人意之处

看到上面翻译的结果,是否颠覆了您对机器翻译的印象呢?实际上,现在的机器翻译结果已经比以前进步了很多。现在的机器翻译,在费用和时间上继续保持相对人类译者的优势。至于翻译精度,我们来看看下面这张表格。之前我对DeepL引擎的机器翻译进行了一系列调查,以对人类译者翻译的精度要求校对了机器翻译的文章,其结果就是下面这张表。

从上面的结果可以看出,机器翻译在长句子、抒情文章、书面文章的翻译的方面还有进步的空间,但对于简单句式,以及专业术语的硬核项目翻译反倒得心应手。当然,上面的结果是以“专业译者翻译之后,能交付客户的精度”作为参考进行得比较严格的把关的结果,如果仅仅是想看看外语文章的大致意思,上面的哪怕“正确率59%”的结果其实都还有一定参考价值。

下面是这个所谓“正确率59%”的翻译结果(节选)

原文: 4月23日午前10時。斜里町のウトロ漁港は灰色の雲に覆われたが、海はなぎだった。気温10.3℃、波は0.3メートル。観光船運航会社「知床遊覧船」にとって、今シーズン初日だった。3隻あるうちの1隻、「KAZU1」(カズワン、19トン)は、北海道や福岡県などの乗客24人を乗せ、知床半島を往復する3時間のコースへ出航した。 KAZU1にとって「いつものクルーズ」のはずがだったが、午後に急変する。

译文: 4月23日,上午10点。 沙里镇的乌托罗渔港被灰色的云层所覆盖,但海面却很平静。 温度为10.3℃,浪高0.3米。 这是旅游船运营商知床观光船这个季节的第一天,它的三艘船之一,19吨的KAZU1号,在知床半岛上航行了三个小时的往返行程,船上有24名来自北海道、福冈县和其他地方的乘客。 这本来是KAZU1的一次 “正常巡航”,但事情在下午突然发生了变化。

如果不和原文进行比较的话,这个结果已经具备一定的水准了。如果仔细确认细节,您会发现有一处固有名词翻译错误(原文是斜里町,译文翻译成了沙里镇),有一处时态错误(原文实际上意思是“开始了向知床半岛的三小时往返行程”)。

正如上面这个例子,机器翻译的结果能提供一定的参考,但如果是用在重要且正式的场合,还是需要人工进行纠正处理的,这样的纠正处理,就是刚才说的译后编辑了。

5. 译后编辑的工期

您可能想知道,译后编辑的效率如何。

通过对机器翻译特点的总结,以及质量标准的把控,我们已经总结出一整套译后编辑的作业标准。具体划分为【简易修改】和【全面修改】。也就是说,根据客户的预算以及对译文质量的要求执行译后编辑。

译后编辑修正包括:

6. 机器翻译的信息安全性

网络空间的安全越来越受到关注,机器翻译既然是线上作业,会不会也会遭遇恶意软件、病毒、勒索软件威胁呢?这一点不用太担心,输入翻译引擎的信息会被翻译引擎自动加密,让第三方无法直接盗取。不过各大机器翻译引擎的服务商安全保障各不相同,最好的方式是货比三家、多听听业内人士的意见、选择有信誉的大厂产品。

这一点上,我司合作的DeepL Pro翻译引擎取得了ISO27001认证,会对数据的传输进行TLS加密并定期审查密码套件,并且不会将数据保存在持久储存上,还采取了最先进的对称加密技术对翻译过程中的文件进行了加密,几重保险,保护数据安全。