1970年,海洋生物学家Roger Payne通过备受赞誉的专辑《座头鲸之歌》首次将座头鲸迷人的声音带给大众。那时,破译这些神秘叫声的可能性似乎是一个离奇的想法,仿佛直接从科幻小说中摘录出来。
但人工智能的突破,尤其是在过去十年中随着计算机处理能力的飞速增长和算法的日益先进,使得这一设想成为现实。去年四月,一个跨学科的科学家和专家团队启动了一项为期五年的工作,名为CETI项目(鲸目翻译计划),旨在利用这些技术进步,破译世界上最大掠食者之一——抹香鲸的语言。
“抹香鲸是非常聪明的、具有高度社会意识的生物,”纽约城市大学的海洋生物学家、CETI项目负责人David Gruber说。“我们相信,通过让人们更接近一种行为、文化和智力都比任何其他现存生物更接近人类的物种,我们可以帮助它们更珍视地球上的所有生命。”
值得探索的想法
CETI项目起源于2017年,当时Gruber是哈佛大学Radcliffe研究所的研究员。一天,他正在收听抹香鲸的“尾声”(sperm whale codas)录音——这是这些海洋哺乳动物用来相互交流的模式化咔哒声——这时另一位Radcliffe研究所的研究员、密码学专家Shafi Goldwasser走了过来。
Goldwasser对此很感兴趣,请Gruber与她的团队分享一些录音,并建议他们可以建立一个项目来理解那些令人难忘的、超凡脱俗的声音究竟意味着什么。尽管她这句话带有开玩笑的意味,Gruber却认为这是一个值得探索的想法。他找到了机器学习专家、也是Radcliffe研究所研究员的Michael Bronstein,想了解人工智能是否可以用于此目的。
Bronstein专攻自然语言处理(NLP),这是人工智能的一个子领域,利用算法来解释书面和口头语言。他确信,抹香鲸的发声适合进行此类分析,因为它们发声的咔哒声结构可以很容易地转化为二进制的“1”和“0”。
碰巧,Gruber认识一位名叫Shane Gero的加拿大生物学家,他花了十多年时间,作为其多米尼加抹香鲸项目的一部分,研究了加勒比东部一个拥有约40个家庭的大型抹香鲸族群,并记录了沿途数百只鲸鱼的声音。他还一丝不苟地为录音添加了详尽的注释,描述了哪些鲸鱼在说话,它们和谁在一起,以及当时动物们的行为。
这足以进行概念验证。利用Gero的数据集,Bronstein让一个NLP算法通过咔哒声检测鲸鱼,并对其部分录音进行运行。该算法正确识别出特定鲸鱼的准确率超过94%,验证了研究人员最初的猜测。Gruber非常激动,随即组建了一个团队,希望在此令人鼓舞的结果基础上更进一步。
收集咔哒声
在TED(一个会议组织)旗下的Audacious Project以及全球多个机构的资助下,CETI团队目前正在致力于解决项目的首要任务:扩大鲸鱼录音的收藏。
“我们可以高效地训练机器学习模型来解决那些我们对其数据结构有深入了解的问题,”麻省理工学院(MIT)的NLP专家、CETI项目成员Jacob Andreas说。“相比之下,现代神经网络不需要所有这些结构,但关于问题领域如何运作的信息必须来自别处,而实际上这意味着我们需要更大的数据集来学习。”
Andreas估计,识别鲸鱼交流中的模式将需要“大约十亿次咔哒声,或1亿到2亿次尾声”。Gero的多米尼加抹香鲸项目数据库目前包含约10万条记录。
为了完成这项庞大的任务,一群专家正在开发一系列非侵入性的视频和音频录音设备。这些设备包括可以深入数千英尺并录制数小时视频的自由游动的机器人鱼;可以全天候录音的高分辨率水听器;以及附着在深海浮标阵列(和鲸鱼本身)上的电子标签。
“由于我们是在鲸鱼的自然栖息地研究它们,因此确保我们的实验设计不会造成干扰或长期困惑至关重要,”Andreas说。
一旦收集到足够的数据,CETI的研究人员将需要将行为和社会背景融入抹香鲸咔哒声的基本结构中,将每种声音与特定的情境联系起来。
“例如,这些动物在捕猎前可能会发出一种特殊的咔哒声序列,或者在生病、怀孕或试图吸引配偶时发出一组特定的声音,”他说。“我们希望通过在不同环境和不同情境下录制鲸鱼,来帮助构建其‘词汇量’的全面图景。”
回应?
如果CETI能够成功破译鲸鱼的语言,研究人员甚至可能尝试与它们进行交流。这将涉及开发一个预测性对话程序,该程序可以生成具有估计含义的发声,然后将其广播给抹香鲸,以评估它们的反应以及是否可预测。
当然,没有人知道抹香鲸是否会接受人类作为对话伙伴。但对Gruber来说,这并不是一个问题,也不是CETI的最终目标。“这一切都不是为了让鲸鱼更好地理解人类,”他说。“而是关于我们正在深入倾听这些神奇动物所说的话——我们尊重它们。”














