天文学正在进入“大数据”的新时代。正在收集的信息量惊人,未来的项目有望提供规模不断增大的数据集。斯隆数字巡天数据发布 14 的总数据量超过 156 TB。到 2018 年,暗能量巡天(每晚收集多达 2.5 TB 数据)将绘制南半球 5,000 度天空的地图,其中包括 3 亿个星系,最终产生约 1 PB(1,000 TB)的数据。当大型综合巡天望远镜于 2022 年开始全面科学运作时,其 3,200 万像素的相机每晚将能够收集 15 到 30 TB 的数据。
随着如此庞大的数据量,处理它们的能力也需要随之提高。这就是公民科学发挥作用的地方,它在推动科学发展方面发挥着独特的作用。
Zooniverse 自称是一个以人为本的研究平台。这个独特的网站将公民科学家——也就是你——与专业研究人员联系起来,利用海量数据目录促进合作和发现。
不仅仅是天文学和物理学受益于这个令人惊叹的平台。Zooniverse 的多样化项目类别包括生物学、历史、气候科学、艺术、医学、生态学和社会科学。如果你厌倦了研究开普勒太空望远镜的凌日数据(系外行星探索者:exoplanetexplorers.org)或表征 LIGO 仪器中的故障以改进引力波探测(引力间谍:gravityspy.org),你可以轻松切换到计算南极洲罗斯海的威德尔海豹(威德尔海豹计数:www.zooniverse.org/projects/slg0808/weddell-seal-count)。或者,也许整理 10 至 13 世纪中东和地中海文本的片段更符合你的风格(开罗吉尼萨的抄写员:www.zooniverse.org/projects/judaicadh/scribes-of-the-cairo-geniza)。
无论你选择探索哪个项目,你都将与全球约 160 万志愿者一起参与科学研究。“Zooniverse 是包容的。我们致力于共同发现,”Zooniverse 创始人兼首席研究员、牛津大学天体物理学教授 Chris Lintott 说。
Zooniverse 成立于 2007 年,是阿德勒天文馆、牛津大学和更广泛的公民科学联盟之间的合作。在过去的 10 年里,该平台已从一个项目发展到目前和已完成的 125 多个“动物园”,将专业研究人员与公民志愿者联系起来,以产生否则无法获得的结果。

系外行星探索者提供光变曲线(随时间变化的亮度测量),以便志愿者可以寻找与凌日行星相关的星光下降。(图片来源:Zooniverse;系外行星探索者:exoplanetexplorers.org)
Zooniverse;系外行星探索者:exoplanetexplorers.org
一个星系动物园
就像它的名字一样,Zooniverse 始于一个动物园。2007 年,Lintott 开发了“星系动物园”,呼吁志愿者查看斯隆数字巡天中的星系数字图像,并将它们分类为螺旋星系、椭圆星系或合并星系。宇宙中有大量的星系,这对需要对包含数百万个星系的数据集进行分类的天文学家来说是一个挑战。当他还是牛津大学的研究生时,原始团队成员 Kevin Schawinski 花了一个月的时间,每天大约 12 小时,只专注于分类星系,最终分类了大约 50,000 个。
这令人印象深刻,但并不是一个现实的维持速度。因此,与其让一个人承担如此巨大的任务,并冒着物体可能被遗漏或错误分类的风险——或者研究人员可能失去理智的风险——不如将任务分配给志愿者呢?尽管你可能认为,识别星系的类型只需要其形状和结构,这并不需要多年的天体物理学研究。它只需要一点点练习,任何人——从学童到退休人员——都可以做到。事实上,人类志愿者比计算机做得更好,计算机在图像中很容易混淆甚至完全遗漏星系。人脑在识别模式方面比任何已设计的计算机算法都要好得多。
这就是 Zooniverse 背后真正的力量。“我们要求志愿者做的事情是计算机不擅长的,”阿德勒天文馆的 Zooniverse 网页开发人员 Zach Wolfenbarger 强调道。
查看单个星系或图像的志愿者越多,最终分类正确的可能性就越大。所以,如果你担心因为你可能错误分类一个物体而影响项目的成果,请不要担心:你将处理的每个图像都会被许多人查看和分类,随着分类数量的增加,最常见的答案在统计学上的显著性也会增加。
Lintott 说,当“星系动物园”启动时,反响非常热烈。一天之内,该网站每小时收到近 70,000 个分类。一年之内,超过 150,000 名参与者提交了超过 5000 万个分类。十年后,“星系动物园”仍在运行 (galaxyzoo.org),尽管有一些变化,包括大幅扩展的数据集。志愿者被要求完成的任务也增加了,从最初只将星系分为少数几组,到现在估计椭圆星系的圆度或扁平度,或螺旋星系的旋臂数量以及其核球的大小和形状。
共同发现
到目前为止,这听起来对研究人员来说是一笔相当划算的交易。毕竟,当你可以让志愿者在空闲时间免费完成时,为什么要自己花几个小时搜寻数据呢?
但 Zooniverse 的好处是双向的。研究人员获得了管理大型数据集和做出新发现所需的帮助,而志愿者则成为一个促进探索、交流和科学进步的社区的一部分。志愿者的名字与项目负责人一起列在发现论文上,数十名志愿者是他们参与数据分析和讨论的文章的共同作者。他们帮助主持每个项目的在线讨论论坛,有时还会参与次要的、更深入的科学任务。他们对正在开发的新项目的反馈指导着研究人员和开发人员改进 Zooniverse 的工作。
通过让公众参与到科学过程中,Zooniverse 将科学的力量交到你手中。该平台还让志愿者亲身体验科学如何从原始数据发展到真实结果。“我们非常专注于让人们参与科学发现的过程,”阿德勒天文馆馆长兼首席执行官 Michelle Larson 说。“我们在生活中的很多正式场合学习科学,但并没有完全体会到其中的奥秘和发现。Zooniverse 与这一重点非常契合。我们希望你来做发现,”她强调说。
每个 Zooniverse 项目都提供了一份入门指南,解释了项目的目标和任务。开发团队不断改进网站,以便以简单、有趣和直接的方式为志愿者提供所需的信息。“我们力求永远不浪费志愿者的时间,”Zooniverse 联合调查员兼阿德勒天文馆公民科学主任 Laura Trouille 说。
整个网络开发团队都认同这一观点,他们通过 Zooniverse 的“讨论”功能(一个针对特定项目的在线讨论板)寻求反馈,并不断努力将每个新项目的具体需求转化为平台中使用的代码和工具。这些反馈不仅来自志愿者,也来自运行项目的研究团队。促进两者之间的开放式沟通使 Zooniverse 得以发展和演变为一个有价值、有吸引力且多功能的公民科学工具。
特鲁伊认为,在线讨论板让志愿者留了下来。她说,每个项目都有一个讨论板,大约 40% 的志愿者会在那里互相交流,并与运行项目的研究人员互动。特鲁伊解释说,这种额外的参与层有助于更大的协作,并最终带来发现。
“当一位研究人员说‘我想做一个 Zooniverse 项目’时,他们就承诺在讨论板上保持活跃,”她说。“他们承诺提供博客文章,更新他们的研究,介绍他们是谁,以及更广泛的研究背景。参与的志愿者社区和实现科学发现的关键在于讨论板上的互动。”
讨论板提供了一个突出奇异发现的场所,例如汉尼的“沃普”(Hanny’s Voorwerp),这是荷兰女教师汉尼·范·阿克尔在 2007 年发现的位于星系 IC 2497 附近的一团“蓝色云雾”。她能够立即引起同行和研究团队的注意,从而带来了一项真正的科学发现,而这项发现很可能被计算机算法当作噪音而忽略。“我们有这个绝佳的机会,全球有 160 万人注册参与 Zooniverse,帮助学习科学,了解科学的本质,了解科学如何运作,”特鲁伊说。能够直接联系研究人员“有点像揭开了研究人员的面纱,他们也只是普通人。”特鲁伊说,Zooniverse 的设计也使得研究人员可以通过“与志愿者互动来提高他们的沟通能力”。它为专业研究人员提供了在他们的舒适区内创建公民科学项目的机会,使他们能够通过有针对性的沟通来推广他们的研究,并在开发和测试阶段直接从志愿者那里获得反馈。
“我认为我们可能会有点迷失在学术是为学者服务的观念中,”阿德勒天文馆的博士后研究员 Samantha Blickhan 说。“Zooniverse 在向学术界展示你可以让公众参与你的工作方面做得非常出色。”
建造一个动物园
Zooniverse 的多样性,部分反映了幕后网络开发团队的多样性。“有如此有趣的各种各样的人被吸引到 Zooniverse 工作,”Trouille 说。“他们都被这个使命深深吸引。他们拥有有趣的背景,他们带给用户体验的东西真正反映了他们的个性。”
从 Zooniverse.org 主页的设计到用户逐步使用时出现的教学弹出窗口,这些开发人员不断努力促进更好的研究和改进两端的用户体验。他们跟踪哪种互动反馈最好,以及什么能让志愿者愿意留下来并做出贡献。例如,“我们在塞伦盖蒂安装了很多相机陷阱,我们发现,如果我们移除所有那些风吹动树枝之类的,没有动物的图像,用户实际上分类的图像数量反而更少,”阿德勒 Zooniverse 网页开发团队的另一位成员 Amy Boyer 说。是发现的乐趣让志愿者保持参与,开发人员力求在每个项目中都保持这种乐趣,同时始终牢记志愿者时间和努力的价值。
Zooniverse 近年来最大的进步之一是发布了其免费的项目构建工具,该工具由 Google 全球影响力奖和斯隆基金会资助。该工具于 2015 年 7 月推出,将创建有效众包研究的能力直接交到研究人员手中。Trouille 说,在该工具发布之前,网络开发团队需要一年时间才能构建大约五个项目。这个数字在 2016 年跃升至 26 个,2017 年跃升至 40 个。
希望通过 Zooniverse 推广的新项目仍需经过严格的 Beta 测试阶段,但该工具对任何人开放,无论他们是否希望与 Zooniverse 建立联系。并且 Zooniverse 的所有代码都是开源的,研究人员和志愿者都可以查看,如果愿意,还可以改进。

(图片来源:Zooniverse)
Zooniverse
100个项目及未来
2017 年,Zooniverse 庆祝其成立 10 周年,并推出了其第 100 个项目:星系育婴室。通过识别给定星系中与特定元素相关的发射线,可以根据其光线因宇宙膨胀而发生的位移量来估计其距离。有了精确的距离,天文学家就可以挑出遥远的“婴儿星系”,研究宇宙在更年轻时的状态。
“星系育婴室”现已达成目标,最终完成了 40 多万次分类和 27,000 多个研究对象。这是 Zooniverse 平台及其项目构建工具所实现的一系列引人入胜的项目中的最新一项。
现在,该平台比以往任何时候都受到更多学科的研究人员的青睐。特鲁伊说,第一篇“星系动物园”论文的评审过程“非常糟糕,因为(众包科学)是全新的”。现在情况已不再如此,目前已有 120 多篇与 Zooniverse 发现相关的同行评审出版物。“AnnoTate 动物园”已证明,志愿者转录手写材料的准确率高达 95%,与经验丰富的专家不相上下。布利克汉强调:“(专家技能)绝对是必要的,但我们正在展示研究人员和志愿者如何相互补充。他们正在共同努力,增强社区。”
此外,“我们有一些令人兴奋的结果表明,人类和计算机协同工作实际上可以产生比任何一方单独工作更好的结果,”博耶说。除了项目产生的科学论文之外,她说,还有几篇“元研究”论文审视了公民科学本身的过程。“Zooniverse 也在不断推动自身发展,”拉森说。“‘引力间谍’项目包含机器学习组件。人类正在完成计算机无法完成的工作……然后将他们的知识反馈给计算机,从而推动编程向前发展,这个过程又重新开始。这就是 Zooniverse 的魔力,它关乎科学进步。”
这份魔力让这个平台取得了十年的成功。“星系动物园”本不应该在十年后还在运行,”林托特说。然而它仍在运行,并成功催生了大量的私人和公共项目,这些项目将科学带入了一个大数据和更大发现的新时代。
如果没有数百万注册 Zooniverse 用户投入时间和分享热情,作为现代科学过程的一部分,这一切就不可能实现。你是其中之一吗?
立即加入!
你准备好了吗?以下是一些目前活跃的 Zooniverse 天文项目,需要像你这样的志愿者来分类真实数据并为新的科学发现做出贡献。太空扭曲 该项目在超大口径巡天(Hyper Suprime-Cam Survey)的数据中寻找引力透镜,这非常适合识别以前未知的透镜,从而一窥遥远的宇宙。该项目的科学团队估计,这项巡天图像中可能有数百个以前未知的透镜,正等待像你这样的志愿者去发现它们。(spacewarps.org)星系动物园 在这个一切起源的项目的最新版本中,“星系动物园”让志愿者在暗能量相机遗留巡天(Dark Energy Camera Legacy Survey)的图像上自由发挥。这个数据集比最初的“星系动物园”项目使用的斯隆数字巡天(Sloan Digital Sky Survey)敏感 10 倍。你将被要求注意每个星系的形状,以及任何奇怪的特征,如潮汐尾、尘埃带、引力透镜或重叠物体。(galaxyzoo.org)
引力间谍 想加入引力波的搜寻吗?引力间谍需要志愿者来表征用于探测引力波事件的极其敏感仪器中的故障和假信号。然后,这些故障可以用来教会算法如何滤除假信号——并识别真实信号。(gravityspy.org) 后院世界 在我们自己的后院潜伏着什么?外太阳系仍然隐藏着许多天体,“后院世界”旨在利用 NASA 广域红外巡天探测器(Wide-field Infrared Survey Explorer)任务的数据来揭示它们。从理论上的第九行星到褐矮星和其他低质量恒星,你可能会发现一个我们从未知道的宇宙邻居。(backyardworlds.org) 超新星猎人 识别超新星——明亮的恒星爆炸——有助于天文学家更好地了解恒星的生命周期,以及绘制我们周围的宇宙地图。“超新星猎人”邀请志愿者检查 Pan-STARRS1 望远镜的数据,以捕捉这些明亮但短暂(因此很容易错过)的事件。(www.zooniverse.org/projects/dwright04/supernova-hunters) 星系建造者 你曾经想建造一个星系吗?如果答案是肯定的,那么你应该查看“星系建造者”这个项目,它让你一点一点地组装星系,以帮助天文学家更好地模拟这些巨大的系统,并确定它们的过去如何塑造它们的现在。(www.zooniverse.org/projects/tingard/galaxy-builder)
星盘侦探 “星盘侦探”项目让你站在行星形成研究的最前沿,它要求志愿者识别被尘埃和气体盘环绕的年轻恒星,这些盘是行星、彗星和小行星的诞生地。你将点击查看美国宇航局广域红外巡天探测器拍摄的图像,该探测器已在红外波长下绘制了整个天空——这是寻找年轻、正在形成的行星系统的完美波段。(diskdetective.org) 行星四:地形 离家更近的“行星四:地形”项目则专注于火星,利用火星勘测轨道飞行器上的背景相机拍摄的图像。你将被要求识别火星南极区域的地形类型,例如“蜘蛛状”、“通道网络”和“瑞士奶酪”,以帮助研究人员区分撞击坑和自然地形。(www.zooniverse.org/projects/mschwamb/planet-four-terrain)














