如今,我们已经解开了古埃及象形文字、玛雅文字以及许多鲜为人知的文字的秘密,似乎没有什么值得有进取心的铭文研究者去研究了。别担心,实际上仍有许多古代文字系统有待破译。其中包括古希腊语(古典玛雅文明之前的玛雅文明文化)、原始埃兰语(现今伊朗最早的文明的文字)以及复活节岛的隆戈隆戈文字。
但如果你追求名声(以及严格的审视甚至死亡威胁),那么就没有比印度河谷文明的符号更具挑战性的了,该文明在大约4000年前兴盛于今天的巴基斯坦和印度西北部。
从这个文化中,考古学家们发掘出了数千个短篇铭文,大多数只有4或5个符号。关于如何解读它们,没有形成共识,尽管在过去一个世纪里已经提出了数十种猜测性的解读。
使解读工作复杂化的是,支撑这种文字的底层语言存在争议,而且这个问题带有复杂的现代政治影响。敌对的族群声称他们是这个曾经伟大的文明的后裔,而了解其语言将有助于巩固文化联系。因此,据报道,学者们在研究此事时受到了威胁。
此外,一些研究者甚至走得更远,否认了底层语言的存在。也就是说,他们认为印度河铭文并非真正的文字——即明确代表语言的可见符号——而是一种类似徽章的替代性符号系统,传达更普遍的含义。
尽管存在反对者和挑战,得益于更完善的文本数据库和用于查找符号模式的新计算方法,过去十年里,解读工作取得了进展。以下是我们目前所知道的。
那个鲜为人知的伟大文明
4000年前,印度河谷文明拥有约一百万人口,分布在一个相当于德克萨斯州大小的区域,是当时埃及或美索不达米亚地区的两倍。其最大的发掘城市哈拉帕和摩亨佐-达罗,展现了堪比现代标准的城市规划水平,包括网格状街道、排水系统和世界上最古老的厕所。然而,没有任何迹象表明存在王权、宗教或军事力量——没有宏伟的宫殿、神庙或防御工事。在公元前2600-1900年兴盛之后,人们不清楚这些人发生了什么,或者今天是否有任何人口可以自认为是他们的后裔。
考古学家和普通民众对印度河文明知之甚少的原因之一是,它直到20世纪20年代才被发现。自那时以来,研究人员已经发现了1000多个似乎属于该文化的定居点。但由于印度-巴基斯坦边境沿线的不稳定局势,只有不到10%的定居点得到了系统的发掘。
印度河文明难以捉摸的另一个原因:那未被解读的文字。
印度河铭文
已经发现了数千件印度河文本,大部分来自哈拉帕和摩亨佐-达罗,也来自沿波斯湾和美索不达米亚的贸易伙伴的遥远土地(印度河文明很可能通过这些有文字的美索不达米亚人接触到了文字的概念)。大多数铭文雕刻在小石印章上,大约一英寸见方,动物的图像,如公牛、大象或独角兽般的生物,位于其上方。在陶土板、陶器和金属制品上发现的铭文较少。

印度河铭文中的字符。(来源:Rao et al. 2009 PNAS)
大多数铭文平均只有4或5个符号,这给解读工作带来了挑战。这也是一些学者认为这些字符不是真正文字的原因之一。大多数其他拥有文字系统的文明留下了数百个字符的例子。相比之下,最长的印度河文字例子不到30个字符。
自2004年以来,甚至还有一个悬赏10000美元的奖金,奖励给任何发现超过50个字符的印度河文本的人,该奖项由一位匿名捐赠者提供,有效期为历史学家Steve Farmer的整个生命周期,他是一位坚决反对印度河文明有文字观点的反对者。
根据所有已知文本中出现的字符数量,研究人员估计有400到700个不同的印度河符号。他们的估计有所不同,部分原因是判断单个符号允许的变异程度的主观性。例如,我手写的“a”可能看起来和你写的“a”不同,但它们是同一个字符。无论如何,有几百个字符表明,这种文字——如果它是文字的话——很可能是语素音节文字,意味着符号代表完整的单词以及音节。我们已破译的其他语素音节文字系统包括美索不达米亚的楔形文字(约600个符号)和玛雅象形文字(约800个符号)。
如何解读失落的文字
学者们已经破译了许多已消失的文字系统,例如古埃及象形文字、美索不达米亚楔形文字,以及最近的相当一部分玛雅象形文字。除了短铭文,为什么印度河文字给我们带来如此大的麻烦?
成功的解读工作遵循了类似的路线(第3部分)。研究人员对可能的字符及其变体进行编目,以推断系统的性质——是字母、音节、表意文字等。然后,他们发现了符号分布和频率的模式。例如,有些字符可能经常出现在一行的开头,或者有些字符可能通常聚集在一起。
尽管存在一些分歧,我们可能已经达到了印度河文字的这个阶段。但严重的解读突破依赖于迄今为止印度河语料库中缺失的三个关键要素。
1) 正确的名称,如国王或城市,已知来自同时期文化的记录。在解读古埃及象形文字的过程中,学者们从古希腊文本中提及的托勒密和克利奥帕特拉等统治者的名字中获益,这些文本当时是可以理解的。至于印度河文明,我们不知道任何历史人物或确切的地名。
2) 双语或三语铭文,记录了相同文本的已知和未知书写系统。对于埃及,那是著名的罗塞塔石碑,一块残破的石碑,用两种埃及文字和古希腊文转录了一份祭司的法令。印度河文明没有发现这样的东西。
3) 文本所转录的语言。对于埃及,成功的翻译者正确地推断出象形文字代表科普特语,一种埃及科普特教堂至今仍在使用的语言。中美洲的土著居民仍然说着玛雅象形文字中的词语。
但印度河语言(或语言)的实际身份存在争议,并且受到现代政治的干扰。目前,许多学者(这里,这里)主张是一种古老的达罗毗荼语,这是一种如今主要分布在印度南部,但在印度北部和巴基斯坦的部分地区(靠近印度河谷文明中心)也有分布的语言。也有人倾向于印欧语系,与古梵语有关,这支持了印度教民族主义者对该文明的主张。还有人提出不同的本土语系,如蒙达语,或者根本没有语言。
我们目前的状况
早在1966年,考古学家Shri B. B. Lal就得出结论,文本通常是从右到左阅读的。但是,正如印度河学者Bryan K. Wells在2015年所写的那样,这“几乎是大多数研究者唯一能达成一致的事实”(第7页)。这一结论基于字符的间距:最右边的符号舒适地对齐在边缘,而最左边的符号则悬空、被挤压或被推低。

不同序列的无序程度。印度河铭文的排序介于DNA(上)和计算机代码(下)之间(来源:Rao 2010 Computer)
Rao 2010 Computer
几十年来,研究人员一直使用统计分析来表明某些符号经常聚集在一起,这表明文本中存在单词和/或单词顺序(我们称之为语法)(这里,这里,这里)——这是对声称印度河符号并非真正文字的反驳。最近,计算机科学家们重振了努力。一种方法分析了文本中符号顺序的随机性或可预测性。通过这种测量,即条件熵,印度河铭文看起来像已知的文字系统,其排序介于像计算机代码那样的高度有序序列和像DNA代码那样无序的序列之间。其他使用统计学和概率论的方法得出了相似的结论:印度河铭文展现出一种具有真正文字特征的可预测性。
解读这些假定的文字需要未来的研究。古代DNA可能很快就能揭示印度河人的祖先,为他们的语言提供线索。并且总有希望,未来的发掘将发现更多信息丰富的文本,一个印度河文明的“罗塞塔石碑”。














