@ 2024.06.14 , 07:04

搞科研越来越不划算了

尽管在研究上投入的时间和资金大幅增加,但进展却勉强能与过去持平。问题出在哪?

作家 Stewart Brand 曾写道,“科学是唯一的新闻”。虽然政治、经济和八卦占据了新闻头条,但科学和技术是人类福祉和我们文明长期进步的重要支柱。这反映在公共对科学投资的巨大增长上。如今,有更多的科学家、更多的科学资金和比以往任何时候都更多的科学论文发表。

从表面上看,这是令人鼓舞的。但是对于所有这些投入的增加,我们是否得到了科学理解的成比例增长?或者说,我们只是在大量投资以维持(甚至看到科学进步速度下降)?

以有意义的方式衡量科学进步出乎意料地困难。部分困难在于,准确评估任何科学发现的重要性都很困难。

想想我们现在称之为电的早期实验。其中许多实验当时看起来很奇怪。在一个这样的实验中,科学家们注意到,在用琥珀摩擦猫毛后,琥珀会神秘地吸引羽毛等物体,而原因不明。在另一个实验中,一位科学家注意到,当一个金属手术刀触碰到一只青蛙的腿时,这只青蛙的腿会意外地抽搐。

即使是从事这些实验的科学家,也无法明确判断它们是无关紧要的好奇心,还是通向更深层事物的一条道路。今天,借助一个多世纪的经验,它们看起来像划时代的实验,是自然界一种新的基本力的早​​期迹象。

但是,尽管评估科学工作的意义可能很困难,但有必要进行这样的评估。我们需要这些评估来颁发科学奖项,并决定哪些科学家应该被聘用或获得资助。在每种情况下,标准做法都是向独立科学家征求他们对所讨论工作的看法。这种方法并不完美,但它是我们拥有的最好的系统。

考虑到这一点,我们进行了一项调查,要求科学家比较他们所在领域的诺贝尔奖获奖发现。然后,我们使用这些排名来确定科学家认为诺贝尔奖获奖发现的质量在几十年中发生了怎样的变化。

作为示例调查问题,我们可能会问一位物理学家,以下是科学理解中更重要的贡献:中子的发现(构成宇宙中大约一半普通物质的粒子)还是宇宙微波背景辐射的发现(大爆炸的余辉)。将调查想象成一个循环锦标赛,发现之间相互竞争,由专家科学家判断哪一个更好。

对于物理学奖,我们调查了世界上顶尖大学物理系的 93 位物理学家(根据上海世界大学排名),他们评判了 1370 对发现。下图中的条形图显示了每十年得的分数。某一十年的分数是该十年的一项发现被评为比其他十年的发现更重要的可能性。请注意,这项工作被归因于发现的年份,而不是随后颁发奖项的年份。

第一十年表现不佳。在那个十年里,诺贝尔委员会仍在确切地确定该奖项的用途。例如,有一个奖项是为改善海上灯塔和浮标的照明方式而设。如果你在船上,这是个好消息,但在现代物理学家看来,它的得分很低。但到了 20 世纪 10 年代,这些奖项大部分都是颁发给符合现代物理学概念的事物。

从 20 世纪 10 年代到 30 年代,紧随其后的是物理学的黄金时代。这是量子力学的发明时期,这是有史以来最伟大的科学发现之一,彻底改变了我们对现实的理解。它还经历了其他几场革命:X 射线晶体学的诞生,让我们得以探测原子世界;中子和反物质的发现;以及关于放射性和核力的许多基本事实的发现。这是科学史上伟大的时期之一。

在那段时期之后出现了大幅下降,并于 20 世纪 60 年代部分复苏。这归功于两项发现:宇宙微波背景辐射和粒子物理的标准模型,我们对构成宇宙的基本粒子​​和力的最佳理论。即使有了这些发现,物理学家也认为从 20 世纪 40 年代到 80 年代的每个十年都比 20 世纪 10 年代到 30 年代的最糟糕的十年更糟。物理学家自己评判的最好的物理学发现变得不那么重要了。

我们的图表截止于 20 世纪 80 年代末。原因是近年来,诺贝尔委员会更倾向于颁发奖项给 20 世纪 80 年代和 70 年代完成的工作。事实上,自 1990 年以来作出仅颁发了三个诺贝尔奖。对于 20 世纪 90 年代来说,这太少了,无法获得高质量的估计,所以我们没有调查这些奖项。

然而,自 1990 年以来奖项的稀缺本身就具有启示性。诺贝尔委员会最强烈地倾向于跳过 20 世纪 90 年代和 2000 年代,并为早期的工作颁发奖项,这是 20 世纪 90 年代和 2000 年代的特有区别。鉴于 20 世纪 80 年代和 70 年代本身就看起来不那么好,这对物理学来说是个坏消息。

我们的调查可能会受到许多合理的反对意见。也许接受调查的物理学家以某种方式产生了偏见,或者对获奖发现的理解不完全。如前所述,很难确定一项发现比另一项发现更重要的含义。然而,科学家的判断仍然是我们比较发现的最佳方式。

即使物理学进展不大,也许其他领域的进展会更好?我们对诺贝尔化学奖和诺贝尔生理学或医学奖进行了类似的调查。这些结果比物理学略微令人鼓舞,20 世纪后半叶可能略有进步。但这很小。与物理学一样,20 世纪 90 年代和 2000 年代被省略,因为诺贝尔委员会强烈偏好较早的工作:与早期几十年中任何类似的时间段相比,20 世纪 90 年代和 2000 年代所做的工作获得的奖项更少。

这项调查描述的画面很严峻:在过去的一个世纪中,我们大幅增加了投入科学的时间和金钱,但根据科学家自己的判断,我们正在以前所未有的速度产生最重要的突破。以每美元或每人计算,这表明科学的效率正在变得越来越低。

现在,一位批评者可能会回应说,诺贝尔奖发现的质量与科学总体进展速度不同。此度量肯定有许多限制。诺贝尔奖没有涵盖科学的某些部分,尤其是计算机科学等较新的领域。诺贝尔委员会偶尔会错过重要的工作。也许某种偏见意味着科学家更有可能崇拜较早的奖项。也许更重要的是科学工作的整体,那些构成科学大部分的普通发现。

我们认识到这些限制:调查结果很惊人,但仅提供了部分画面。然而,我们很快就会看到支持证据表明,全面进行重要发现变得越来越困难。它需要更大的团队和更广泛的科学训练,总体经济影响正在减小。综合起来,这些结果表明,我们的科学努力正在递减。

当我们向同事报告这些递减回报时,他们有时会告诉我们这是无稽之谈,并坚持认为科学正在经历一个黄金时代。他们指出了最近惊人的发现,例如希格斯粒子、引力波,这些都是科学比以往任何时候都处于更好的状态的证据。

这些确实是惊人的发现。但前几代人也做出了同样重要、甚至更重要的发现。例如,比较引力波的发现与爱因斯坦 1915 年发表的广义相对论的发现。广义相对论不仅预测了引力波,而且还彻底改变了我们对空间、时间、质量、能量和引力的理解。引力波的发现虽然在技术上令人印象深刻,但对我们对宇宙的理解改变却小得多。

虽然希格斯粒子的发现令人惊叹,但它在 20 世纪 30 年代发现的一系列粒子面前相形见绌,包括中子(我们日常世界的主要组成部分之一)和正电子,也被称为反电子,它首先揭示了反物质的幽暗世界。从某种意义上说,希格斯粒子的发现之所以非凡,是因为它回到了 20 世纪上半叶常见的局面,但在最近几十年却很少见。

另一种常见的回应来自那些说科学比以往任何时候都好的人,因为他们自己的领域正在取得巨大进展。我们最常听到的是人工智能 (AI) 和生物学中的 CRISPR 基因编辑技术。但尽管 AI、CRISPR 和类似领域的发展确实很快,但整个现代科学史上一直有一些领域像它们一样热门或更热门。

想想 1924 年至 1928 年间物理学的发展。在那段时间里,物理学家们了解到物质的基本组成部分既具有粒子又具有波动性质;他们制定了量子力学的定律,导致了海森伯的不确定性原理;他们预测了反物质的存在;以及其他许多内容。正如领先的主角之一保罗·狄拉克所说,这是一个“即使二流物理学家也能做出一流发现”的时代。

相比之下,过去几年来人工智能的主要发现包括对图像和人类语音的识别能力的提高,以及比任何人类都更能玩好诸如围棋之类的游戏。这些都是重要的成果,我们乐观地认为人工智能领域的工作将在未来几十年产生巨大的影响。但要产生这些结果需要花费更多的时间、金钱和精力,而且尚不清楚它们是否比 20 世纪 20 年代发现的现实重新排序更重大。

同样,CRISPR 在过去几年取得了许多突破,包括改造人类胚胎以纠正遗传性心脏病、以及创造出能够通过整个蚊子种群传播疟疾抗性的蚊子。但尽管这样的实验室原理验证是卓越的,而 CRISPR 的长期潜力是巨大的,但最近的这些结果并不比生物学快速发展的早期的阶段更令人印象深刻。

为什么科学变得更加昂贵,却没有产生与我们理解相应的收益?

这个问题的部分答案由经济学家本杰明·琼斯和布鲁斯·温伯格的研究提出。他们研究了当老科学家做出伟大发现时他们的年龄。他们发现,在诺贝尔奖的早期,未来的诺贝尔科学家在做出他们获奖发现时平均年龄为 37 岁。但在最近,这一平均年龄已上升至 47 岁,增加了科学家职业生涯的约四分之一。

也许今天的科学家需要知道更多才能做出重要的发现。结果,他们需要学习更长时间,所以在他们完成最重要工作之前,年龄也更大。也就是说,重大发现变得更加困难。如果它们更难发现,那就表明它们的出现更少,或者它们需要更多的努力。

与此类似,科学合作现在常常涉及比一个世纪前更多的人。当欧内斯特·卢瑟福在 1911 年发现原子的原子核时,他以一篇仅有一位作者(他自己)的论文发表了它。相比之下,2012 年宣布发现希格斯粒子的两篇论文各约有 1000 名作者。平均而言,20 世纪研究团队的规模几乎增加了 4 倍,而且这种增长还在继续。对于许多研究问题而言,今天取得进展需要更多的技能、昂贵的设备和大团队。

如果科学真的变得更加困难了,为什么会这样呢?

假设我们认为科学——探索自然——类似于探索新大陆。在早期,知之甚少。探险家们出发,轻松地发现主要的新特征。但逐渐填补了对新大陆的了解。为了做出重大发现,探险家们必须前往更偏远的地区,在更困难的条件下。探索变得更加困难。在这种观点中,科学是一个有限的疆域,需要更多的努力来“填写地图”。总有一天地图将接近完成,科学将基本耗尽。在这种观点中,发现的任何困难都是科学知识本身结构内在的。

这种观点的原型来自基础物理学,在那里许多人被对“万物理论”的搜索着迷,一种解释我们所看到的世界上所有基本粒子​​和力的理论。我们只能发现一次这样的理论。如果你认为那是科学的主要目标,那么它确实是一个有限的疆域。

但还有一个不同的观点,一种科学是无限疆域的观点,其中总有新的现象需要去发现,以及重大的新问题需要去回答。无限疆域的可能性是出现了一个称为涌现的概念的结果。例如,考虑水。用方程描述单个水分子行为的方式是一回事。想明白为什么彩虹在天空中形成、海洋波涛汹涌或叫我们彗星的太空中脏雪球的起源是另一回事。所有这些都是“水”,但处于不同的复杂性层面。每一个都从描述水的基本方程式中涌现出来,但是谁会从这些方程式中怀疑过像彩虹或海浪冲击这样的错综复杂的事物?

纯粹出现行为层面并不一定意味着将会有无穷无尽的新现象需要发现,以及新的问题需要回答。但在某些领域似乎是可能的。例如,考虑一下计算机科学,它始于 1936 年,当时艾伦·图灵开发了我们现在称之为图灵机的计算数学模型。该模型极其简陋,几乎就像儿童玩具。然而,该模型在数学上等同于今天的计算机:计算机科学实际上始于它的“万物理论”。尽管如此,它自那以后见证了许多非凡的发现:例如为互联网商业和加密货币提供基础的加密协议;编程语言设计中包含的永无止境的精彩创意;甚至更异想天开的是,一些在最好的视频游戏中看到的富有想象力的想法。

这些是计算机科学的彩虹、海洋波浪和彗星。更重要的是,我们迄今为止的计算经验表明,它确实取之不尽,始终有可能发现美丽的新现象、行为的新层面,这些现象和行为提出了基本的新问题,并催生了新的探究领域。计算机科学似乎是开放式的。

以类似的方式,随着我们获得编辑基因组、合成新生物的能力以及更好地理解生物体基因组与其形态和行为之间的关系,生物学中也有可能不断开辟新的领域。类似的事情也可能发生在物理学和化学上,例如可编程物质和物质的新型设计阶段。在每种情况下,新现象都会提出新问题,这可能是一种开放式的方式。

因此,乐观的看法是,科学是一个无止境的前沿,我们将继续发现甚至创造全新的领域,他们有自己基本的问题。如果我们今天看到放缓,那是因为科学过于专注于已建立的领域,在这些领域取得进展变得更加困难。我们希望未来将看到新领域的更快速扩张,从而产生重大的新问题。这是科学加速的机会。

如果科学正在遭受递减的回报,那对我们长期未来意味着什么?是否会有更少的新科学见解来激发 100 多年来如此重塑我们世界的这种新技术?事实上,经济学家看到了这一现象的证据,他们称之为生产力放缓。

当他们谈论生产力放缓时,经济学家是以一种特殊的方式使用“生产力”,尽管与日常含义接近:粗略地说,工人的生产力是制造东西的智慧。因此,当我们开发技术并做出更容易制造东西的发现时,生产力就增长了。

例如,1909 年,德国化学家弗里茨·哈伯发现了固氮法,一种从空气中获取氮并将其转化为氨的方法。然后,这种氨可以用来制造化肥。这些肥料允许相同数量的工人生产更多的食物,因此生产力提高了。

生产力增长是一个经济健康社会的标志,一个不断产生想法来提高其创造财富能力的社会。坏消息是,美国的生产力增长大幅下降。自 20 世纪 50 年代以来,这一增长一直在下降,当时它的增长速度大约是今天的六倍。这意味着我们今天在大约十年内看到的变化与我们在 20 世纪 50 年代 18 个月内看到的大致相同。

这听起来可能令人惊讶。难道我们在过去几十年里没有看到许多发明吗?难道今天不是加速技术变革的黄金时代吗?

经济学家泰勒·科文和罗伯特·戈登并不这么认为。在他们的著作《伟大的停滞》和《美国增长的兴衰》中,他们指出 20 世纪初大规模部署了多种强大的通用技术:电力、内燃机、无线电、电话、航空旅行、生产线、化肥还有更多。

相比之下,他们整理的经济数据表明,自 20 世纪 70 年代以来,事情几乎没有多大变化。是的,我们取得了与两种强大的通用技术相关的进步:计算机和互联网。但许多其他技术只得到了渐进的改进。

例如,想想汽车、航空旅行和太空计划在 1910 年到 1970 年之间的社会转型,扩大了人们对世界的体验。到 1970 年,这些旅行形式已经达到接近现代的形式,雄心勃勃的项目,例如协和飞机和阿波罗计划,在很大程度上未能进一步扩大交通运输。也许像自动驾驶汽车这样的技术将给未来的交通带来戏剧性的变化。但与过去相比,最近在交通方面的进展是渐进式的。

是什么导致了生产力的下降?这个问题在经济学家之间是有争议的,并且提出了许多不同的答案。一些人认为,仅仅是因为现有的生产力衡量标准无法很好地衡量新技术的影响。我们的论点在这里提出了不同的解释,即对科学支出的递减回报正在导致真正的生产力下降。

我们并不是第一个提出科学发现呈现递减回报的人。在他的 1996 年的著作《科学的终结》中,科学作家约翰·霍根采访了许多领先的科学家,并询问他们所在领域的发展前景。著名的生物学家本特利·格拉斯在 1971 年在《科学》上发表了一篇文章,认为科学的辉煌时代已经结束,告诉霍根:

对于我来说,无论如何很难相信达尔文的进化论或孟德尔的遗传本质理解这样的全面而具有划时代意义的东西很容易再出现。毕竟,这些已经被发现了!*

霍根的发现并不令人鼓舞。以下是领先的理论物理学家利奥·卡达诺夫对科学的最新进展的看法:

事实是,没有什么——没有什么——与发明量子力学、双螺旋结构或相对论的成就具有相同数量级。在过去几十年中,根本没有发生过那样的事情。

霍根问卡达诺夫这种状态是否永久。卡达诺夫沉默了一下,然后叹了叹气回答说:“一旦你证明了世界对许多人类是合法的,你就不能再那样做了。”

但是,尽管许多个人对科学的递减回报提出了担忧,但机构的反应却很少。气象学家凯尔文·德罗梅耶(Kelvin Droegemeier)是当前提名唐纳德·特朗普总统科学顾问的人,他在 2016 年对美国参议院委员会表示,“发现的速度正在加快”。在国家科学基金会 2018 年的报告中没有提到递减回报的问题,相反,它乐观地谈到了“可能具有变革性的研究,这些研究将产生开创性的发现,并在科学上开辟令人兴奋的新领域”。当然,许多科学机构,尤其是新机构,确实致力于在各自领域寻找改进运营方式的方法。但这与对递减回报的组织化制度反应不同。

也许这种回应的缺乏部分原因是,一些科学家认为承认递减的回报背叛了科学家的集体私利。大多数科学家强烈支持更多的研究资金。他们喜欢从积极的角度描述科学,强调好处并最小化负面影响。虽然可以理解的是,有证据表明,就每花费的美元或小时而言,科学已经大幅放缓。这一证据需要大规模的制度回应。它应该是公共政策、资助机构和大学的主要主题。更好地理解导致这一现象的原因很重要,而确定扭转这一现象的方法是我们改善未来的最大机会之一。

本文译自 The Atlantic,由 BALI 编辑发布。

赞一个 (5)