大型强子对撞机每秒钟能粉碎10亿对质子。有时,对撞机可能搅动现实,产生一些前所未见的东西。但由于这些事件从本质上说是一种意外,物理学家并不确切地知道自己要寻找什么。他们担心,在把数十亿次对撞产生的数据缩减至更易于管理的规模时,也许会无意中删掉物理学的新发现。“我们总是担心,在倒洗澡水时会连小孩一起倒掉。”纽约大学粒子物理学家凯尔·克兰默(Kyle Cranmer)说道,他参与了欧洲核子研究中心的ATLAS(超环面仪器)实验。

强子对撞机惊天秘密(大型强子对撞机20年时间才能完成的工作)(1)

大型强子对撞机今年4月进行的一次对撞实验:橙色线条为带电粒子,黄色锥体为大粒子喷流。

面对这种智能数据简化的挑战,一些物理学家正在尝试一种名为“深度神经网络”的机器学习技术,通过它来挖掘海量的熟悉事件,以期发现新的物理现象。

在经典用例中,一个深度神经网络学会了辨别猫和狗,办法就是馈入一堆被标记成“猫”的照片和一堆被标记成“狗”的照片,让它进行研究。但在搜寻新的粒子时,这种方法是行不通的,因为物理学家无法把自己从未见过的东西的照片馈入机器。因此,他们转向了“弱监督学习”,也就是让机器从研究已知的粒子起步,然后利用粗粒度信息——比如它们发生的总体频率是多少——来寻找罕见事件。

强子对撞机惊天秘密(大型强子对撞机20年时间才能完成的工作)(2)

在今年5月发表于arxiv.org的一篇论文中,三位研究人员提出利用一种相关策略来拓展所谓的“凸块搜寻”,科学家正是利用这种传统的粒子搜寻方法发现了希格斯玻色子。据论文作者之一、美国劳伦斯伯克利国家实验室的研究员本·纳赫曼(Ben Nachman)称,其总体思路是训练机器找出数据集中的罕见变化。

想象这样一个基于辨别猫狗的玩具模型,如果有一个数据集是对北美各地森林的观察结果,现在的问题是要试着从中发现一个新的动物物种。假设新物种倾向于聚集在特定的地理区域(就好比一种新粒子可能因为特定的质量聚集在一起),那么计算机算法应该能通过系统地比较相邻区域,将它们识别出来。假如加拿大不列颠哥伦比亚省恰好有113头北美驯鹿,华盛顿州有19头(即使观察结果中还有数百万只松鼠),算法也可以学会将松鼠与驯鹿区分开来,即便它从来没有直接学习过关于驯鹿的信息。“这不是魔法,但感觉像是魔法。”俄勒冈大学的理论粒子物理学家蒂姆·科恩(Tim Cohen)说道。他也在从事弱监督学习的研究。

相比之下,粒子物理学中的传统搜寻方法通常需要研究人员对新现象会是什么样子做出假设。他们会创建一个模型,来界定新粒子的行为特征,比如说,一种新粒子可能会衰变成特定的已知粒子集合。只有在他们定义了自己想要寻找的东西之后,才能设计出特定的搜寻策略。这样的工作通常需要一位博士生至少花上一年才能完成,而纳赫曼认为,我们能够以更快、更全面的方式完成它。

这项研究提出的算法名为CWoLa,全称“Classification Without Labels”(无标签分类)。它可以在现有数据中搜寻未知粒子,后者要么衰变成两个较轻的相同类型未知粒子,要么衰变成两个不同或是相同类型的已知粒子。使用常规的搜寻方法,大型强子对撞机至少需要20年时间,才能分析出后一种情况的可能性;而对于前一种情况,目前则根本无计可施。参与ATLAS项目的纳赫曼表示,CWoLa可以一口气完成所有这些工作。

强子对撞机惊天秘密(大型强子对撞机20年时间才能完成的工作)(3)

其他粒子物理学家认同,CWoLa可能是一个有价值的项目。“我们已经研究了多种可能性,因此现在开始关注我们此前未曾关注过的地方,这对我们来说是接下来的一个重要方向。”物理学家凯特·帕查尔(Kate Pachal)说道,她参与了ATLAS项目中搜寻新粒子“凸块”的工作。去年,帕查尔跟几位同事反复讨论过一个想法,希望设计出一种灵活的软件,用于对一系列粒子质量进行处理,但当时,他们对机器学习都不甚了解。“现在,我觉得也许是时候试试这个了。”她说。

研究人员期望,神经网络能够在数据中找出利用当前建模技术无法找到的微妙相关性。另一些机器学习技术已经成功地提高了大型强子对撞机执行某些任务的效率,比如,识别由底夸克粒子产生的“喷流”。这项工作无疑表明,物理学家的确忽视了一些信号。“他们忽略了一些信息,当你在一台机器上花费了100亿美元时,你不会希望是这种结果。”加州大学欧文分校的粒子物理学家丹尼尔·怀特森(Daniel Whiteson)说。

不过,机器学习也时常会闹笑话,诸如把手臂和哑铃弄混的例子也俯拾即是,这对我们也是一种警示。在大型强子对撞机项目中,也有一些人担忧,这种取巧之道最终可能把机器本身的异常当成信号来处理,而实验物理学家通常需要费很大的劲才能做出区分。“一旦发现了异常现象,你如何知道它是新的物理学发现,还是探测器本身的故障呢?”ATLAS项目的物理学家蒂尔·艾菲特(Till Eifert)问道。

翻译:何无鱼

校对:李莉

编辑:漫倩

来源:Quanta Magazine

造就:剧院式演讲,发现创造力

更多精彩内容,敬请点击蓝字“了解更多”。

,