成千上万块楔形文字泥板堆积在那里,等待被翻译。这并非易事;这种古老的语言基于楔形象形文字,包含1000多个独特字符,且因时代、地理和书写者个人的不同而有所差异。
但解读这些象形文字可能是一项具有文化和历史意义的任务。楔形文字约在5000年前起源于美索不达米亚,即现在的伊拉克。它是四种已知独立的语言之一——即没有任何已知其他语言影响的书写系统。一些已翻译的楔形文字泥板揭示了像运输库存记录这样平淡无奇的内容。另一些则更为深刻——比如“吉尔伽美什史诗”,这是已知的第一部书面文学作品。
这些由少数懂该语言的人完成的翻译工作,需要付出大量的劳动——或许还有一些猜测。一些康奈尔大学的研究人员认为,解读如此复杂的语言是人工智能的完美任务。他们与特拉维夫大学的同事合作,创建了一个系统来完成这项工作,他们在一篇将在2025年4月会议上发表的论文中报告了这一成果。
人工智能解读古老泥板
研究团队开发了一个系统,克服了变异性给翻译带来的诸多障碍。
“当你回到古代世界时,字符的形式存在巨大的变异性,”领导这项研究的康奈尔大学计算机科学教授Hadar Averbuch-Elor在新闻稿中说道。“即使是同一个字符,其外观也会随时间而变化,因此自动解读字符的实际含义是一个非常具有挑战性的问题。”
该计算机系统读取粘土楔形文字泥板的照片,然后通过计算将图像与具有相似特征且含义已知的图像进行叠加进行调整。由于系统会自动对齐两张图像,直到它们在数字上契合,因此他们将该系统命名为ProtoSnap。
阅读更多:像 ChatGPT 这样的人工智能语言模型能否解锁神秘的古代文本?
我们可以从古代文本中学到什么
在论文中,研究人员证明了捕捉到的字符可以用来训练该系统,以便在后续过程中识别其他字符之间的相似性,他们称之为下游。当系统接受这样的训练后,ProtoSnap在识别楔形文字字符——即使是罕见的字符或差异很大的字符——方面,比之前的人工智能努力表现得更好。
这一进步可以帮助自动化泥板阅读过程。这将节省大量时间。它还可以帮助学者更好地比较不同时代、不同城市和不同作者的书写。但最重要的是,它将极大地加速翻译过程——最终让世界能够接触到大量的古代文献。
“我们研究的基础是希望将可供我们使用的古代文献来源增加十倍,”特拉维夫大学考古学教授、联合作者Yoram Cohen在新闻稿中说。“这将使我们首次能够处理大数据,从而对古代社会——它们的宗教、经济、社会和法律生活——产生新的可衡量见解。”
虽然许多翻译的泥板可能只会显示,例如,一笔牲畜购买的收据,但另一些则可能包含引人入胜的历史记载——甚至可能包含另一部史诗。
文章来源
我们的Discovermagazine.com作家在文章中采用同行评审研究和高质量来源,我们的编辑会审阅科学准确性和编辑标准。请查看本文使用的以下来源
康奈尔大学和特拉维夫大学。ProtoSnap:楔形文字符号的原型对齐














