人工智能, 数学
数学家利用AI在椭圆曲线中发现了意想不到的模式
数学家利用人工智能在椭圆曲线中发现了意想不到的模式,这些模式类似于鸟类集体飞行的形态,被命名为“murmurations”。这项发现不仅加深了人们对椭圆曲线的理解,也为解决千禧年难题之一——Birch 和 Swinnerton-Dyer 猜想提供了新思路。
椭圆曲线是现代数学中最令人着迷的对象之一。它们看起来并不复杂,但却在高中数学和最深奥的研究数学之间架起了一座桥梁。在上世纪 90 年代,椭圆曲线在 Andrew Wiles 证明费马大定理的过程中发挥了核心作用。它们是现代密码学中的关键工具。2000 年,克莱数学研究所将椭圆曲线的统计特性猜想列为七个“千禧年难题”之一,每个难题的解决都能获得一百万美元的奖金。这个由 Bryan Birch 和 Peter Swinnerton-Dyer 在 1960 年代首次提出的猜想至今仍未被证明。
理解椭圆曲线是一项意义重大的挑战,也是数学研究的核心。因此,当 2022 年一个橫跨大西洋的合作团队利用统计技术和人工智能在椭圆曲线中发现了完全出乎意料的模式时,这是一个令人欢迎的、意想不到的贡献。“机器学习迟早会带着有趣的东西登上我们的舞台,这只是时间问题,” 高等研究院和普林斯顿大学的数学家 Peter Sarnak 说。最初,没有人能解释这些新发现的模式为何存在。从那以后,在一系列最近的论文中,数学家们开始解开这些模式背后的原因,并将它们命名为“murmurations”,因为它们类似于成群结队的椋鸟所形成的流动形态。他们还开始证明这些模式不仅存在于 2022 年研究的特定例子中,而且在更一般的椭圆曲线中也普遍存在。
椭圆的重要性
理解这些模式是什么,我们需要先了解一下什么是椭圆曲线以及数学家如何对它们进行分类。
椭圆曲线将一个变量 (通常记为 y) 的平方与另一个变量 (通常记为 x) 的三次方联系起来:y² = x³ + Ax + B,其中 A 和 B 是满足一定条件的两个数字。这个方程定义了一个可以绘制在平面上的曲线,如下所示。(尽管名称相似,椭圆 (ellipse) 并不是椭圆曲线 (elliptic curve)。)
虽然看起来很简单,但椭圆曲线被证明是数论学家 (研究整数中模式的数学家) 的强大工具。数论学家不局限于让变量 x 和 y 遍历所有数字,而是喜欢将它们限制在不同的数系中,他们称之为在给定的数系上定义曲线。限制在有理数 (可以用分数表示的数) 上的椭圆曲线特别有用。“在实数或复数上,椭圆曲线相当枯燥,” Sarnak 说,“只有有理数才深刻。”
以下是证明这一点的一种方法。如果你在椭圆曲线上的两个有理点之间画一条直线,这条直线再次与曲线相交的点也将是有理数。你可以利用这个事实来定义椭圆曲线上的“加法”,如下所示。
在 P 和 Q 之间画一条直线。这条直线将在第三个点 R 处与曲线相交。(对于直线不与曲线相交的情况,数学家们有一种特殊的技巧,即添加一个“无穷远点”。)R 关于 x 轴的镜像就是 P + Q 的和。通过这个加法运算,曲线的所有解形成一个称为群的数学对象。
数学家们利用这一点来定义曲线的“秩”。曲线的秩与它所拥有的有理数解的个数有关。秩为 0 的曲线只有有限个解。秩更高的曲线有无限个解,这些解彼此之间的关系可以用秩来描述,并通过加法运算来表示。
秩鲜为人知;数学家们并不总是能计算出秩,也不知道秩的最大值是多少。(已知特定曲线的最大秩为 20。)看起来相似的曲线可能具有完全不同的秩。
椭圆曲线还与素数 (只能被 1 和它本身整除的数) 密切相关。具体而言,数学家们研究有限域上的曲线 - 为每个素数定义的循环算术系统。有限域就像一个时钟,小时数等于素数:如果你一直向上计数,数字会重新开始。例如,在 7 的有限域中,5 加 2 等于 0,5 加 3 等于 1。
椭圆曲线与一个称为 ap 的数列相关,该数列与曲线在由素数 p 定义的有限域中的解的个数有关。ap 越小,解越多;ap 越大,解越少。虽然秩难以计算,但 ap 数列要容易得多。
基于对一台早期计算机进行的大量计算,Birch 和 Swinnerton-Dyer 猜想了一个椭圆曲线的秩与其 ap 数列之间的关系。任何能够证明他们猜想正确的人将赢得一百万美元和数学界的永垂不朽。
意外的模式出现
2020 年 8 月,伦敦数学科学研究所的研究员 Yang-Hui He 决定接受一些新的挑战。他本科主修物理,并在麻省理工学院获得了数学物理博士学位。但他对数论越来越感兴趣,并且鉴于人工智能的不断进步,他认为可以尝试用人工智能作为一种工具来寻找数字中的意外模式。(他之前已经使用机器学习来分类卡拉比-丘流形,这是一种在弦理论中被广泛使用的数学结构。)
2020 年 8 月,随着疫情的加剧,诺丁汉大学邀请他进行了一次线上演讲。他对自己的进展和使用机器学习来发现新数学的可能性并不乐观。“他的观点是,数论很难,因为你无法用机器学习来学习数论,” 在场的西敏寺大学数学家 Thomas Oliver 说。正如 He 回忆的那样,“我什么也找不到,因为我不是专家。我甚至没有用正确的工具来研究这个问题。”
Oliver 和康涅狄格大学的数学家 Kyu-Hwan Lee 开始与 He 合作。“我们决定做这件事只是为了了解机器学习是什么,而不是认真研究数学,” Oliver 说。“但我们很快发现,你可以用机器学习来学习很多东西。”
Oliver 和 Lee 建议 He 将他的技术应用于研究 L 函数,这是一种与椭圆曲线密切相关的无限级数,通过 ap 数列与椭圆曲线相关联。他们可以使用一个名为 LMFDB 的在线椭圆曲线及其相关 L 函数数据库来训练他们的机器学习分类器。当时,该数据库拥有超过 300 万条有理数上的椭圆曲线。到 2020 年 10 月,他们发表了一篇论文,利用从 L 函数中收集的信息来预测椭圆曲线的特定性质。11 月,他们又发表了一篇论文,利用机器学习来对数论中的其他对象进行分类。到 12 月,他们能够以很高的准确度预测椭圆曲线的秩。
但他们并不确定为什么他们的机器学习算法如此有效。Lee 要求他的本科生 Alexey Pozdnyakov 看看他能否找出原因。碰巧的是,LMFDB 根据一个称为导数的量对椭圆曲线进行排序,该量概括了曲线在哪些素数下无法正常工作的信息。因此,Pozdnyakov 尝试同时查看具有相似导数的大量曲线 - 例如,所有导数在 7,500 和 10,000 之间的曲线。
这总共涉及约 10,000 条曲线。其中约有一半的秩为 0,另一半的秩为 1。(更高的秩极为罕见。)然后,他分别对所有秩为 0 曲线的 ap 值进行平均,对所有秩为 1 曲线的 ap 值进行平均,并将结果绘制出来。两组点形成了两个截然不同的、容易辨认的波浪。这就是机器学习分类器能够正确确定特定曲线秩的原因。
“起初,我只是觉得自己完成了任务,” Pozdnyakov 说。“但 Kyu-Hwan 立即意识到这种模式是令人惊讶的,这才变得真正令人兴奋。”
Lee 和 Oliver 非常兴奋。“Alexey 向我们展示了这张图,我说它看起来像鸟类做的那种事情,” Oliver 说。“然后 Kyu-Hwan 查了一下,说它叫做 murmurations,然后 Yang 说我们应该把论文命名为 ‘Murmurations of Elliptic Curves’。”
他们在 2022 年 4 月上传了他们的论文,并转发给了其他几位数学家,忐忑不安地等待着被告知他们所谓的“发现”是众所周知的。Oliver 说,这种关系是如此明显,以至于应该早就被发现了。
解释模式
2023 年 8 月,Lee、He 和 Oliver 在布朗大学的数学计算与实验研究所 (ICERM) 组织了一次关于 murmurations 的研讨会。Sarnak 和 Rubinstein 以及 Sarnak 的学生 Nina Zubrilina 都参加了会议。
Zubrilina 展示了她对模形式中 murmuration 模式的研究,模形式是特殊复函数,与椭圆曲线一样,具有相关的 L 函数。在具有大导数的模形式中,murmurations 会收敛成一条清晰定义的曲线,而不是形成一个可辨识但分散的模式。在 2023 年 10 月 11 日发表的一篇论文中,Zubrilina 证明了这种类型的 murmuration 遵循她发现的一个明确公式。
“Nina 的重大成就是她为此给出了一个公式;我称之为 Zubrilina murmuration 密度公式,” Sarnak 说。“她利用非常精密的数学,证明了一个完全符合数据的精确公式。”
她的公式很复杂,但 Sarnak 称赞它是重要的全新函数类型,可与定义物理学中各种应用的微分方程解的 Airy 函数相媲美,应用范围从光学到量子力学。
虽然 Zubrilina 的公式是第一个,但其他人也紧随其后。“现在每周都会发表一篇新论文,” Sarnak 说,“主要使用 Zubrilina 的工具来解释 murmuration 的其他方面。”
布里斯托大学的 Jonathan Bober、Andrew Booker 和 Min Lee 以及 ICERM 的 David Lowry-Duda 在另一篇 10 月份的论文中证明了模形式中存在另一种类型的 murmuration。Kyu-Hwan Lee、Oliver 和 Pozdnyakov 证明了狄利克雷特征中存在 murmuration,狄利克雷特征与 L 函数密切相关。
Sutherland 对导致 murmuration 发现的重大偶然性印象深刻。如果椭圆曲线数据不是按导数排序,murmurations 就会消失。他说:“他们很幸运能够从 LMFDB 中获取数据,该数据库根据导数进行了预排序。” “这是将椭圆曲线与相应的模形式联系起来的原因,但这并不明显。… 两个看起来非常相似的曲线的导数可能非常不同。” 例如,Sutherland 指出 y² = x³ – 11x + 6 的导数为 17,而将减号符号翻转为加号,y² = x³ + 11x + 6 的导数为 100,736。
即使这样,murmurations 也只因 Pozdnyakov 的缺乏经验而被发现。Oliver 说:“我认为如果没有他,我们不可能发现它,” “因为传统上,专家会对 ap 进行归一化,使其绝对值为 1。但他没有对它们进行归一化… 所以振荡非常大且明显。”
人工智能算法用于根据秩对椭圆曲线进行排序的统计模式存在于具有数百个维度的参数空间中 - 这对于人们来说,即使是可视化,也无法在脑海中进行排序,Oliver 指出。但尽管机器学习发现了隐藏的振荡,“直到后来我们才理解它们是 murmuration。”
本文译自 Quanta Magazine,由 BALI 编辑发布。