追溯到遥远的过去,语言翻译是一项高度专业化的职业,对于协调外交或国际贸易至关重要。第一本双语词典,《Vocabularius ex quo》——是一本 1467 年出版的德语-拉丁语词汇集,而包含苏美尔语和阿卡德语词汇列表的泥板则可以追溯到公元前 2300 年。
多年来,由于语言学家和其他人类学家的努力,语言翻译在许多方面变得更加容易。计算机的出现,以及最终人工智能的发展,极大地推动了语言翻译的进步,使其摆脱了专家或厚重书籍的束缚,进入了我们的手机。
但是,像谷歌翻译这样的翻译应用程序是如何随着时间发展的,它们的先驱是什么?
计算机翻译是如何开始的
人们自 20 世纪中叶以来就一直在尝试使用计算机进行语言翻译。
DeepL 公司首席执行官 Jaroslaw Kutylowski 表示:“在线翻译的想法是人们在计算机出现时就一直在追求的东西。”该公司使用神经网络系统提供翻译服务。
事实上,计算机除了用于数字之外的早期应用之一是 1954 年的一次实验,这是乔治城大学和 IBM 研究人员经过数年努力的结果。演示只使用了六条语法规则翻译了大约 250 个单词——主要是关于科学、法律和军事事务的简短俄语句子,这些句子在几秒钟内被翻译成英语。
然而,这个程序的可能性是有限的,翻译需要大量的后期编辑。在接下来的十年里,进展不大。事实上,实验的结果并不令人鼓舞,以至于美国政府设立的自动语言处理咨询委员会(由语言学家和机器翻译研究人员组成)在 1966 年发布的一份报告中得出结论,近期内并没有太大希望。
“委员会确实认为,本着科学的精神继续前进是明智的,但这样做的动机不能是任何可预见的实际翻译改进,”报告说。
阅读更多:古代人有时也需要翻译语言——尽管并不常见,但他们是这样做的
SYSTRAN 的开端
这份报告有效地扼杀了多年来大部分翻译工作,除了 System and Translation (SYSTRAN)。Peter Toma,一位相信世界和平可以通过沟通实现的科学家,在 20 世纪 60 年代末创立了 SYSTRAN。
该公司与美国空军合作,并使用机器将俄语指令翻译成英语,用于阿波罗-联盟号测试计划,这是 1975 年启动的一项美苏联合太空任务。
SYSTRAN 继续开发其产品,该产品被在线搜索引擎 AltaVista 使用,AltaVista 在 20 世纪 90 年代末创建了 Babel Fish,后来被雅虎收购。至少在早期,该工具的翻译能力是有限的,一次只能处理多达 150 个单词。
Kutylowski 说:“这需要大量工作,并且需要语言学家和编码员的共同努力,”他还补充说,对于像日语或芬兰语这样“语法极其复杂”的语言,情况会更加复杂。
直到 2006 年,谷歌才赶上雅虎,推出了谷歌翻译。后者变得越来越复杂,从简单的在线文本翻译发展到手机应用程序。2014 年,谷歌收购了 Word Lens,它允许用户将手机摄像头对准路标或菜单等上面的文字,即可获得翻译。Word Lens 还帮助谷歌提高了对口语的识别和翻译能力。
阅读更多: 你的母语可能会以独特的方式塑造大脑
人工智能的作用
问题在于,语言翻译充其量仍然是一门不完美的科学。Kutylowski 表示,总的来说,计算机翻译的世界在过去大约半个世纪里,从一次翻译一个单词,到短语,再到句子。
但机器仍然容易忽略上下文之类的内容,使得具有两个或多个含义的词有时难以翻译。但在 2016 年,人工智能为机器翻译开启了新的可能性。谷歌开始采用神经机器翻译,这基本上意味着创建一个神经网络,它不仅可以翻译单词或短语,还可以翻译整个段落。
Kutylowski 说:“DeepL 从 2017 年开始使用神经网络构建翻译程序,将其销售给国际公司。‘我们一直处于神经网络的淘金热中。’‘翻译在私人和商业领域都有着广泛的应用。’”
他说,要做到这一点,需要大量的已经在一门语言和另一门语言之间翻译过的文本。专家最好需要科学文本、法律文本以及各种已翻译的语言来教会机器学习系统如何更好地运行。
神经机器翻译是一种试图创建更像人脑的神经系统的尝试。Kutylowski 说,它不是教授语法,而是像人类一样直接学习文本,而人类可以在不隐式学习任何语法规则的情况下学会一门语言。
他说:“这种整体的学习过程和系统的整体运行方式,都朝着我们作为人类学习语言的方式发展。”
这些系统在翻译方面的能力越来越强,但它们很可能永远会有缺陷。问题是,沟通是一门不完美的科学,即使对于说同一种语言的两个人也是如此。在线翻译程序能做的最好的翻译,只能与人们最初的沟通能力一样好。
文章来源
我们的Discovermagazine.com作家在文章中采用同行评审研究和高质量来源,我们的编辑会审阅科学准确性和编辑标准。请查看本文使用的以下来源
History of Information. 机器翻译首次公开演示
National Academies Press. 语言与机器:计算机在翻译和语言学中的应用 - 美国国家科学院、工程院和医学院
NASA. 阿波罗-联盟号测试计划















