分享

从ATM到CAT:自动翻译机是如何发展的?

 译品译味 2022-04-27

从即时反应的翻译软件,到所谓的AI同传,机器翻译技术越来越普及,但机器翻译是如何发展的?机器翻译真的能够取代人工翻译吗?本期共读,让我们跟随David Bellos教授,一起探索自动翻译机奇幻的发展历程。

ATM的起源

注意,此ATM非彼ATM,不是指自动取款机(Automated Teller Machine),而是自动翻译机(Automatic Translation Machine)

最初,ATM的发明并非为了语言交流,而是为了探测敌国信息,满足军事需要。

冷战初期,美苏双方展开军备竞赛。为防止苏联赶超,了解其原子弹的研究进展,美国需快速阅读苏联最新研究期刊。由于俄语在美国的普及率很低,组建一支熟悉科学知识的俄语人工翻译团队显然不现实,于是美国就发明了自动翻译机。

自动翻译机的发展与密码学也有不小关系。

二战期间,密码学飞速发展,这门关于编码和解码的学科也引发了关于语言和翻译的思考。

二战时期的解密机器

代码或密码是呈现信息的一种方式,使用钥匙就能解锁信息。而语言本身也是一种编码,只不过不同的语言使用的密码不同。

语言加密的又是什么呢?按照西方对语言的认识,语言解码后呈现的是其意义和思想。正如一句古谚所说,语言是思想的外衣

因此,翻译机器的运作逻辑便是首先脱离A语言的文字限制,解码输出文字背后所表达的真实含义,再用B语言组织语句,表达思想。

那么,该如何设计翻译机器的运作流程呢?

自古以来学习语言都有两个基本任务:背诵词汇,掌握语法

通过词典可以认识词汇,通过学习语法则可以掌握词汇之间如何发生逻辑关系,构成有意义的句子。

最初的翻译机器就是这样设计的,既可以存储单词,又可以按照一定的语法规则分类。但在组织句子这一步,瓶颈出现了:

①虽然机器可以掌握某种语言大部分的语法规则,但实际运用中会出现很多特例

②真正表达出原文的含义,还需要了解语言背后的世界文化背景知识(点击这里了解「世界知识」在翻译中的作用)

比如,机器如果不了解原文所指代的真实事物,就无法判断pen到底应该取哪个含义:

The pen is in the box

(笔在盒子里)

The box is in the pen

(盒子在围栏里)

逻辑学家巴尔·希勒尔受雇于麻省理工学院期间,专门研究「全自动高质量翻译」,即FAHQT (fully automated high-quality translation)。他发现,即使电脑能储存一定量的单词和语法,也难以实现真正的全自动高质量翻译,原因正是上面提到的两点。

从ATM到CAT

1957年,欧盟成立,各种语言之间的翻译需求大增。

快速发展的各大公司亟需一种工具提升翻译广告文案、说明书的效率,助其产品广销全球。这种与冷战时期不同的政治因素和强大的资金支持再次推动了自动翻译机的研究。

但这时,人们不再追求完美的自动翻译,而是依靠计算机辅助,存储大量的术语和语料,实现非全自动翻译,又称计算机辅助翻译,CAT (computer-aided translation)

常用CAT软件

进行CAT操作时,首先需要输入A语言相关文本,由计算机程序操作后,再由译员进行人工审校,确保以B语言输出的语句准确表达了原文含义。

今天,我们输入A语言的某个句子或单词到任何一款字典软件,点击「双语例句」,就可以看到至少数十条语料库里的相关例句。这一切始于20世纪90年代互联网的普及和谷歌的出现。

谷歌的出现是自动翻译机发展历程的一大转折点。

谷歌的自动翻译器不再专注于如何解码语法,而是通过强大的计算能力,实现两种语言互译文本的输入、搜索与匹配。谷歌翻译器会先大量存储之前已经翻译过的文件,形成语料库,再在短时间内计算搜寻类似用法,得出最匹配的句子。

谷歌翻译器的「翻译」,其实是在无数人工翻译形成的语料库基础上实现的。谷歌翻译输出的内容也会留在网络上,成为新一批语料库,形成反馈环

有趣的是,谷歌翻译从某种程度上也与真人译者类似。译者需要长期的翻译实践和经验,谷歌翻译也同样是在自己长期积累的记忆库里进行搜索和匹配,然后迅速得出答案。

所以,比起早期承载着全自动化翻译使命的翻译机器,如今谷歌翻译的模式更像专业翻译。

那么,谷歌翻译是如何发展到如今近乎专业的模式的呢?专业译员又该以怎样的心态应对越来越「人工智能」的机器翻译?

欢迎大家在评论区留言,说说自己的看法。下期共读,我们将与大家一起探讨谷歌的神经网络翻译与AI潮流下的机器翻译,敬请期待~

文案:李泽慧

排版:李泽慧

审定:朱玲 刘俐雅 马欣悦

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多