物理学家训练AI理解标准宇宙模型后,遇到"负迁移"效应:学得越好越难发现异常。
宇宙学家常年淹没在海量的数值计算和超级计算机模拟中,AI一度被视为最理想的救兵。但一篇发表在《宇宙学与天体粒子物理期刊》上的新论文发出了一记清醒警钟:当AI把宇宙模型学得太好时,它反而可能成为发现新物理的最大绊脚石。

研究中使用的Quijote模拟生成的两幅图像。这些图板展示了宇宙的同一区域,但基于不同的宇宙学模型。
研究团队的实验设计相当精巧。首先,他们训练一个神经网络学习标准宇宙学模型(ΛCDM)的模拟数据,让AI熟练掌握暗物质、暗能量和宇宙大尺度结构之间的标准关系。接下来,他们将这个预训练过的AI应用于分析超出标准模型的理论场景,例如大质量中微子的影响、暗能量随时间的演化,以及修正引力理论的表现。研究者预期预训练会加快这些分析,但结果出了偏差。
AI确实表现出了"学习效率"的优势:它用比传统方法少得多的模拟数据就理解了标准模型。然而,当新物理的信号恰好与标准模型参数空间中的某些已知模式产生类似的数据特征时,AI陷入了机器学习领域所称的"负迁移"效应。模型无法分辨两种不同物理机制造成的相似观测数据,于是本能地套用已学到的标准模型解释去削平新信号,导致那些真正指向新物理的微弱差异被算法吞没。
研究合著者、Flatiron研究所与普林斯顿大学的宇宙学家Adrian E. Bayer在采访中说,负迁移现象"引人入胜",因为它表明"模型并非随机失败,而是受到了结构化偏见的系统性影响"。他强调,弄清迁移学习何时是加速器、何时是障眼法,是决定AI能否在未来宇宙学数据分析中被可靠部署的关键前提。Bayer给出了一条简洁的准则:"加速和理解必须同步进行,谁也不能甩开谁。"
论文带来的不仅是方法学上的警告,也是一记关于科学哲学的提醒。今天的宇宙学正处在一个数据洪流的时代——DESI、欧几里得太空望远镜、薇拉·鲁宾天文台等大型巡天项目正在以前所未有的精度和广度测绘宇宙。AI无疑是处理这些数据不可或缺的工具,但Bayer团队的工作表明,工具本身也会塑造使用者的认知框架。当AI在标准模型的舒适区内学得越好,它在面对异常信号时的认知惯性就越强。如何在效率与开放性之间找到平衡,将是下一代宇宙学AI的核心挑战。
更具体的技术细节显示,研究团队使用的是基于模拟数据的迁移学习方案。他们首先生成了标准ΛCDM模型的大规模模拟结果作为训练集,然后用参数微调的方法将AI迁移到扩展模型场景。负迁移的发生具有规律性:当新物理参数与标准模型参数在观测效应上高度简并(即产生难以区分的相似特征)时,AI倾向于忽略新信号而将其归入已知类别。这种行为的根本原因是神经网络的归纳偏置:模型天然偏好与训练数据一致的简单解释。在宇宙学中,这种特性恰好与科学发现的需求背道而驰,因为发现新物理的本质就是寻找与标准模型不一致的异常。
原文:https://gizmodo.com/ai-learned-how-the-universe-works-and-that-created-an-unexpected-problem-for-physicists-2000770643