广告

寻找小峰(第二部分)

探索可能预示粒子物理学突破的诱人希格斯信号,尽管存在统计涨落。

作者:John Conway
Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

是真的吗?我抬头望着 40 号大楼的中庭,两件事变得清晰起来。首先,有了这样一个小的“凸起”结果,还有很多工作要做。其次,我最好尽快回到费米实验室,而不是留在欧洲核子研究组织。我把机票改签到了下周一,因为第二天没有空位了。这意味着我必须在欧洲核子研究组织度过一个周末来工作。我给还在睡觉的美国同事发了邮件,然后就开始忙碌起来。当你看到一个像我们这样的频谱图,其中有几个区间的数据速率比正常情况要高时,这可能意味着多种情况。总是可能你忽略了某些背景,探测器和分析的模拟不完美,或者仅仅是统计涨落。高能粒子碰撞遵循量子力学,因此本质上是随机过程。如果你期望在运行一段时间后看到具有特定特征的特定数量的事件,那么在实际实验中你看到的数字可能不完全是那个数字。如果你期望看到 10 个事件,你可能会观察到 8 个,或者 12 个,或者更罕见的 20 个。在我们称之为“可见质量”的频谱图上,正是这种情况:有几个区间的事件数比预期的要多。那么,这究竟是统计涨落,模拟的错误,还是一个真实信号的开端?正如一句老掉牙的学生实验报告所说:“我们的实验数据不够,所以我们不得不依赖统计学”。在我们这个领域,我们一直都在使用统计学。我们希望对那些让你后脖子发凉的事情,或者让你打哈欠的事情做出量化的陈述。量化意味着我们可以尽可能客观,并为我们的同事和世界提供对数据的理性解释。进行这类分析是我在粒子物理学中的专长。现在是时候在这里做了。作为我们领域的一种通用语言,我们试图将所有统计学问题都追溯到经典的“正态”分布,也就是熟悉的钟形高斯分布。高斯分布的峰值在中间,两侧有长长的尾部。将它视为对某个测量结果给出特定结果的预期频率的指示是相当恰当的:大多数情况在中间,在尾部较少。它由“标准差”或“1 sigma”来表征,因为我们用希腊字母 sigma 来表示它。如果你的测量值符合高斯分布,大约 2/3 的时间它会落在峰值左右一个 sigma 的范围内。在 1/6 的情况下,它将高于一个 sigma。偏离峰值 sigma 越多,发生的可能性就越小。在粒子物理学中,我们总是会遇到统计涨落,所以要发现一些真正新颖的东西,我们必须要求随机涨落导致过剩的可能性非常非常小。通常,我们要求达到五 sigma,也就是距离峰值五个标准差,才能声称“发现”。统计显著性较低时,我们会谨慎使用“证据”或“迹象”等词语。那么,这次的显著性有多高呢?我迅速启动了我的程序来拟合包含希格斯信号的频谱图,果然,数据显示更倾向于一个质量约为 160 GeV 的超对称希格斯,或者大约是质子质量的 170 倍。峰值速率与我们的灵敏度相当一致。而且,更棒的是,该质量点的统计显著性约为 2.5 个标准差。低于这个水平,人们不太感兴趣,但在此时,它就开始变得令人着迷了。问题在于,这是一次“碰撞点搜寻”,而我们不知道碰撞点会出现在希格斯质量的哪个位置,因为我们不知道希格斯质量是多少!这意味着真正的问题是:一个随机涨落是否可能在频谱图的任何位置,而不仅仅是 160 GeV 处,给我们带来这样一个“凸起”?这个计算将需要一段时间。我需要运行一个随机模拟,生成大量没有希格斯信号的可能实验结果,然后拟合所有可能的希格斯质量的频谱图,看看我得到 2.5-sigma 结果的频率有多高。我开始编写代码。幸运的是,我拥有进行计算所需的所有组件,并将它们拼接在一起,一边进行测试。然后是时候启动这个任务了。我将代码移到加州我们计算机集群上,并设置了脚本,将计算分配到多台计算机上。通过一个简单的命令,我启动了 20 个 CPU,生成随机频谱图,并在没有希格斯信号的地方寻找希格斯。这看起来需要几天时间才能得到答案。令我持续惊叹的是,仅仅 15 年前,欧洲核子研究组织最先进的计算设备是我们巨大的 VAX 9000,这实际上是最后一批大型机。Windows 桌面 PC 对我们来说毫无用处,因为我们无法对其进行编程,而 Unix 工作站虽然开始流行,但速度仍然不够快。所以现在我启动的任务使用了比旧 VAX 多约 2000 倍的计算能力。而这仅仅是 20 个 CPU!我们现在拥有一个全球性的网格,可以访问数以万计的节点,而且还在不断增加。所以在此期间,是时候评估这个“凸起”对我们极限设定的影响了。当我打开盒子时,我本以为不会看到任何希格斯信号的迹象,然后就可以排除某些超对称参数空间区域,因为如果大自然选择存在于那里,我们就会看到希格斯信号。在这方面,我们通常的统计标准有点宽松:我们要求“95%置信度”来排除某个参数集。实际上,这意味着如果该参数集为真,我们看到我们所看到的或更大的希格斯过剩的几率为 5% 以下。你需要花很长时间来理解为什么需要这种颠倒的逻辑。问题在于,有一个关键是我们不知道的:希格斯存在与否的概率!有了这个过剩的信号,我们将只能排除比我们希望的少得多的区域。我运行了简短的作业来计算速率限制,并将它们发送给 Amit 进行转换成最终的 SUSY 参数限制,然后开始编写所有内容。在我们合作中,有一个非常正式的内部评审流程来发布结果。我们需要在两次面向相关物理分析会议的演示之前记录所有内容。第一次演示称为“预祝福”,在那里大家会毫不留情地提出问题。演示者会受到关于分析的每个方面的深入、尖锐问题的轰炸,通常会持续一个小时或更长时间。虽然有时看起来像一场血腥的运动,但这是科学过程中绝对必不可少的一部分:如果我们自己不成为我们最尖刻的批评者,那么别人就会替我们做。Anton 现在醒了,收到了关于过剩信号的消息,并开始问所有正确的问题。Amit 也加入了进来,我们迅速制定了一个计划:我们必须在周日午夜前发布这份报告,我们分配了工作。他把参数限制发回给我,我用 Illustrator 把它们变成了一张漂亮的图表。

广告

图中深紫色区域显示了我们排除的参数值,置信度为 95%。标记为“预期”的区域是我们认为能够排除的。显然,由于涨落,我们尚未达到预期的灵敏度。随着我们获得的数据越来越多,我们预计排除的区域将覆盖图表中越来越多的部分,下降到越来越低的“tan beta”,这是主要的 SUSY 参数之一。我们说明了我们的结果对输入假设的轻微依赖性,并与几年前在欧洲核子研究组织 LEP 2 加速器上获得的限制进行了比较。我们取得了进展,但那个小小的“凸起”正在阻碍我们。我周一回到了费米实验室,与 Anton 和 Cris 开会集思广益,讨论可能存在的问题和可能出现的问题。Anton 将在周四进行演示,我们需要“装甲化”这个结果,这肯定会引起很多尖锐的问题。他在记录方面做得非常出色——我们的报告长达 70 多页,其中充斥着大量图表,将控制样本和其他子样本中的数据与模拟进行比较。一切都检查过了——没有理由相信那个小小的“凸起”不是统计涨落,就是新事物。我的统计显著性作业得到了答案:随机涨落给我们带来如此大的“凸起”的几率约为 2%。这大约是 2-sigma 的效应,在我们领域里每天都会出现和消失。尽管如此,我们都是人,不得不猜测这是否是真的。演示进行得很顺利——我们获得了“预祝福”,并被安排在新年的第一周进行最终祝福,也就是在我阿斯彭演讲的前一周。我们确实没有遇到什么难题,因为我们做了充分的准备。在节日期间,我们可以预期与合作者进行一些问答和评论,并有更多时间进行交叉检查。但在三周后的祝福演讲中,一些没有参加预祝福演示的人听说了这个过剩的信号,并出现在会议上提出尖锐的问题。但最终,我们获得了祝福,我获得了在次周二阿斯彭会议上展示结果的“绿灯”。我整个周末都在为这次演讲做准备,现在我将大部分注意力集中在新结果上,这将是引起大家最大兴趣的。如今,能在阿斯彭这样高规格的会议上演讲,同时展示自己全新的结果,是相当罕见的——有点像“完美风暴”。我的态度是展示事实并得出显而易见的结论:我们需要更多数据!正如预期的那样,我的演讲中引起最多兴趣和问题的是我们的新结果。这在这个领域里真是太有趣了!然而,之后,在滑雪场上,我们竞争对手实验 Dzero(位于 Tevatron)的一位同事,来自布朗大学的教授 Greg Landsberg,向我暗示他们的实验也即将完成一项结果。这占据了我下午的思绪。他们看到了什么?他们也有过剩的信号吗?去年有过一个小小的暗示,但没什么令人兴奋的。在晚上的会议上,Greg 泄露了天机:Dzero 的数据是一个“赤字”,而我们那里有一个“过剩”!我宁愿他等一两天再告诉我,但最终,世界会知道的。他们的方法和我们很相似,所以很难逃脱这样的结论:如果他们确实有一个赤字,我们的过剩更有可能是一个统计涨落。我们仍在等待他们的答案,应该很快就会出来。好消息是,我们很快就会有两倍的数据来进行分析。到初夏,我们应该能更清楚地了解我们看到的是什么。一周后,Anton 将在一个周五的费米实验室“葡萄酒和奶酪”研讨会上展示结果,尽管名字温文尔雅,但我知道这是最艰难的听众之一。在那里,面对 150 人的观众,一个问题就可能迅速演变成一连串的质问,演讲者几乎喘不过气来。但 Anton 是个真正的专业人士,我非常期待在那里见证这一切。考虑到这个“凸起”的信号实际上并不显著,我们已经引起了相当大的轰动。我收到了来自各地的请求,希望看到我的阿斯彭幻灯片,并回答问题。上周我去欧洲核子研究组织(CERN)携带新的像素探测器时,许多听说过这个结果的人拦住我,想了解更多信息。在我看来,这表明人们最终迫切希望弄清希格斯粒子,无论其本质是什么,同时也表明 Tevatron 在大型强子对撞机(LHC)开启之前,有机会取得重大发现。真正的物理学数据将来自 LHC,预计在明年年中!最终,总有一天,我们的数据中会出现一些新的东西,而我们不能回避它。我们已经很长一段时间没有真正的新发现,没有真正改变范式的观测了。我们已经习惯了涨落的出现和消失,并且对任何新出现的涨落都抱有应有的怀疑。但我想,我在那个周六早上瞥见了当我们真的拥有新的、真实的东西时会是什么感觉,而这是一种我希望有一天能再次拥有的感觉。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章