您当地的自然历史博物馆可能将最令人印象深刻的化石陈列在显眼位置,以吸引游客。但一些博物馆的抽屉里还收藏着大量其他遗骸,这些遗骸可以揭示它们起源时代的有用细节。通常,没有科学文献描述这些化石,只有博物馆工作人员才能接触到它们。研究人员称这些未经研究的物品为“暗数据”。
在国家科学基金会的资助下,古生物学家 Peter Roopnarine(加州科学院无脊椎动物动物学和地质学馆长)以及他的全国同事们正努力将这些暗数据公之于众。近十年来,他们一直致力于为这些被遗忘的化石建立完整的数字记录。
Roopnarine 及其团队在最近的《生物学通讯》论文中强调了这一项目的必要性。他们发现,在加州的一些收藏品中,暗数据化石产生的数据量是现有档案的 23 倍。
《探索》:首先,您能谈谈当前化石记录系统的不足之处吗?
Roopnarine:几百年来,我们一直在发表关于化石出土、描述和发现的文章。这些信息都在文献中,但要汇编起来非常困难,因为它们散布在许多不同语言的期刊中。这实际上只代表了已收集材料的一小部分,而这些材料的很大一部分就存放在世界各地的博物馆里。
问:那么,为什么直到最近几年才开始数字化记录的工作呢?
答:过去 20 年里,一些博物馆一直在将它们的目录在线发布。然而,我们缺乏将所有这些信息整合在一起的技术。每个人都使用自己开发的、不同的系统,但我们需要一种通用的语言来描述博物馆里的材料。一旦我们有了规范化的语言,我们就可以用这种通用语言来输入我们的数据,这样我们就能理解彼此的目录和收藏品。这些是非常困难的问题,一旦你克服了它们,就无法回避这样一个事实:你需要有人实际在那里工作,将所有这些数据以电子形式提供。
问:到目前为止,研究人员在数字化暗数据方面取得了哪些可衡量的进展?
答:我们查看了 [NSF 资助的] 古生物数据库,该数据库汇集了所有已在科学文献中发表过相关材料的加州化石产地。然后,我们将其与我们从博物馆收藏品中记录的产地总数进行了比较,其中许多我们知道从未发表过。在我们最近的汇编中,产地和数据点的数量是我们过去向科学界公开的数字的 23 倍。















