AI“读心”新进展：精准重现大脑所见影像

想象一下，人工智能(AI)不仅能“读懂”你的心思，还能以惊人的准确度重现你眼前所见的景象，这听起来是不是像科幻电影里的情节？如今，这一幕正逐渐变为现实。通过赋予人工智能系统聚焦特定大脑区域的能力，科学家们在根据大脑记录重建猴子所视图像方面取得了显著进展。

人工智能系统现在已经能够基于大脑活动的记录，相当精确地重构出一个人或动物所看到的画面。更令人兴奋的是，当人工智能学会了“有的放矢”，懂得将注意力集中到大脑的哪些关键部位时，这些重建图像的质量更是得到了大幅提升。

来自荷兰拉德堡德大学的Umut Güçlü对此评价道：“据我所知，这些是我们目前所见过的最接近真实、最为精确的视觉重建结果了。”他的话语中透露出对这项技术的信心。

Umut Güçlü的团队并非孤军奋战，全球还有其他几个研究小组也在致力于利用人工智能系统，通过分析大脑记录和扫描数据来解读动物或人类的视觉内容。例如，在先前的一项研究中，他的团队就曾使用功能性磁共振成像(fMRI)扫描仪，记录了三名参与者在观看一系列照片时的大脑活动。

而在另一项研究中，该团队则更进一步，通过植入式电极阵列直接记录了一只猕猴在观看人工智能生成的图像时的大脑活动。不过，Umut Güçlü在拉德堡德大学的同事Thirza Dado特别强调，这些电极植入手术是由其他团队出于别的研究目的而进行的。她解释说：“我们并不是为了进行感知重建而给猕猴植入电极的，这绝不能成为对动物进行手术的理由。” 这也体现了科研工作中的伦理考量。

现在，研究团队利用一套经过改良的人工智能系统，重新分析了这些早期研究中收集到的数据。这套新系统的过人之处在于，它能够自主学习在解读大脑信号时，应该重点关注哪些大脑区域。

Umut Güçlü生动地解释道：“从本质上讲，人工智能就像一个聪明的学生，在解读大脑信号的过程中，它逐渐学会了应该将‘目光’投向何处。当然，这种注意力的导向，也间接反映了大脑信号本身捕捉到的环境信息是怎样的。”

得益于这种直接记录的大脑活动数据，部分重建出的图像与猕猴实际看到的由StyleGAN-XL图像生成人工智能所创造的画面惊人地相似。然而，Thirza Dado也指出，精确重建由人工智能生成的图像，要比重建真实的自然照片相对容易一些。这是因为在生成这些AI图像的过程中所使用的一些特定处理方法，可以被整合到负责图像重建的人工智能的学习算法中，从而降低了重建的难度。

即便是在使用功能性磁共振成像(fMRI)扫描数据时，当引入这种能够引导注意力的人工智能系统后，图像重建的质量也同样有了显著提升。尽管如此，其精确度仍不及基于猕猴大脑直接记录的重建结果。Thirza Dado解释说，这部分是由于fMRI实验中使用的是真实照片，另一方面，从fMRI扫描数据中重建图像本身就更具挑战性。她形容道：“fMRI虽然是非侵入性的，但其信号中也夹杂着大量的‘噪音’。”

展望未来，该研究团队的终极目标是开发出更先进的脑机接口设备，用于恢复视力。他们的设想是，通过直接刺激视觉系统中负责表征物体的高级区域，而非仅仅呈现光点图案，来实现这一目标。

Umut Güçlü举例说明道：“比如，你可以直接刺激大脑中对应‘狗’这个概念的特定区域。通过这种方式，我们或许能够为失明者创造出更丰富、更接近于正常视力者所体验到的视觉感受。” 这无疑为视觉修复领域描绘了一幅激动人心的蓝图。

原文： New Scientist