人工智能
数字孪生:医生现在可以看到你的“虚拟分身”
通过创建循环系统的数字孪生,Amanda Randles希望为医疗预测带来前所未有的精准度。
Amanda Randles希望复制你的身体。这位计算机科学家希望拥有足够的数据和处理能力,能够在她的电脑上有效地克隆你,快进时间,看看你的冠状动脉或红细胞在一周内会发生什么。尽管完全个性化的医学模拟(即“数字孪生”)目前还超出我们的能力范围,但Randles已经在长期血流计算模型方面取得了突破,这些模型已经在帮助医生非侵入性地诊断和治疗疾病。
在1990年代的密歇根州,作为一名青少年,Randles已经设想了一种结合编码和生物学的职业。她毕业于杜克大学,获得了物理学和计算机科学学位,在IBM工作了三年,期间她接触到了Blue Gene超级计算机。之后,她在哈佛大学获得了应用物理学博士学位。在那里,她建立了一个名为Harvey的血液循环模型,后来将其搬到了杜克大学的数字孪生实验室。2023年4月,她因其开创性的研究获得了计算机协会计算奖和25万美元的奖金。
她的最新系统可以获取患者血管的3D图像,然后模拟并预测血液的流体动力学变化。使用该系统的医生不仅可以测量脉搏和血压等常规数据,还可以观察血管内的血液行为。这使得他们能够观察到血流中的漩涡和血管壁所承受的压力——这两者都与心脏病有关。十年前,Randles的团队只能模拟大约30个心跳的血流,但现在他们可以预测超过70万次心跳(大约一周的时间)。由于他们的模型是交互式的,医生还可以预测如果他们采取如开药或植入支架等措施会发生什么。
Quanta杂志与Randles就过多数据的利弊、图形如何帮助桥接生物学和计算以及机器学习的潜在影响进行了对话。以下是经过整理和编辑的采访内容。
你何时首次想到计算可以帮助医生治疗患者?
我上高中时就读于一个数学和科学中心。我们在学习生物学和科学的同时也在学习计算机编程,所以两者有很多交叉点。然后我在大学二年级时在一个遗传学实验室工作,那里使用了大量计算技术来进行患者特定的基因组分析和其他细胞技术。
那时候你对超级计算机感兴趣了吗?
我甚至不知道怎么说——当我加入IBM时,我不知道什么是超级计算机。我只知道他们在用计算机进行生物研究。我不太理解超级计算机的意义。我原本在德州面试一个操作系统的职位,后来他们打电话说,“我们在明尼苏达有一个IBM Blue Gene超级计算机团队的空缺。”我很幸运能加入那个团队。
你是何时意识到循环模型可以工作的?
我们的2010年论文是首次捕捉整个冠状动脉树的——即你所有的冠状动脉——在一个心跳期间的细胞分辨率。这篇论文使用了Harvey的前身MUPHY。看到一个二维或三维的模拟图像有正确的几何结构真的很有成就感。
当我们需要做一些改变时,我们转向我自己从头开始编写的模型。第一次看到Harvey中的动脉和血流时,我记得对实验室的某人说,“我有一张图!”
为什么这张图很重要?
我有一个共同导师,Hanspeter Pfister,他是图形专家。我们引入了他团队的一些人在迪士尼和皮克斯等地实习的人才。我们从他们已经在为这些计算机优化图形的方法中汲取了很多经验:我们创建的动脉3D网格文件与他们为动画角色制作的非常相似。移动角色的手臂并变形那个网格的方式与我们放入虚拟支架的方式相同。
这些预测不仅仅是你想得到的一个数字。有一个叫“壁剪应力”的量,它只是对壁的摩擦力。我们已经证明,当医生能够在动脉的不同部分可视化壁剪应力时,他们可能会改变所选择的支架长度。这确实影响了他们的决定。
我们还表明,在边界情况下,涡流与长期的不良效果有关。所以医生可以看到哪里有高涡流。这可以帮助医生决定需要什么类型的干预,比如支架或药物。
Harvey还有哪些不同之处?
我们想要一个可以测试不同物理模型的代码,能够扩展到模拟全身血流,捕捉复杂的细胞行为,并能很好地与虚拟现实接口集成以进行虚拟手术。MUPHY并没有研究全身的血流。我们试图将其拓展。
此外,MUPHY是由意大利人编写的。许多注释是意大利文的,我看不懂(笑)。
你如何知道这些预测实际上是准确的?
在一项160名患者的研究中,我们表明Harvey可以准确匹配患者的测量值。标准护理是将导丝直接插入动脉以在任何狭窄前后测量压力——这两个数字的比值称为“分数流储备”。我们用模拟来非侵入性地计算相同的东西。
但这种对视觉的需求使得计算更加困难,对吗?
是的,现在我们面临的一个大难题是数据量。数据量很大。我们正在运行的模拟有多达5.8亿个红细胞。有与流体和红细胞的相互作用,细胞之间的相互作用,细胞与壁的相互作用——你试图捕捉这一切。对于每个模型,一个时间点可能是半个TB,而每个心跳有数百万个时间步。这真的很计算密集。
你的团队试图使用机器学习工具来减少计算需求。效果如何?
我们最近有一篇论文介绍了一种系统,该系统需要大约10分钟来训练每个患者的新模型。然后你可以使用机器学习来预测,例如,如果你改变动脉狭窄的程度(即动脉狭窄的程度),总体血压会变成什么样?目前FDA批准的工具需要大约24小时为那个患者训练。在这里,你可以在患者还在诊所时实时互动。
这种巨大飞跃的背后是什么?
这是机器学习与较小物理模型的结合。我们计算出每个患者的训练需要模拟多少种外科治疗选项才能提供实时预测。我们使用一维模型,而不是依赖三维模型进行机器学习训练。它只是沿着血管的中心线计算——这捕捉了三维结构但不是流动的完整x、y、z坐标。这是较小的数据,因此训练速度更快。而且你可以使用不同的机器学习算法,使其运行速度更快。
这种改进肯定有代价。使用机器学习会失去什么?
我们总是希望事情是可解释的,特别是当它进入临床时。我们希望确保医生知道他们为什么做出决定,并能解释哪些因素影响了那个预测。当它变成黑箱时,你会失去一些这种解释性。现在,我们的很多工作都是试图理解不确定性。传感器需要多精确才能导致血流模拟的变化?
此外,你还需要注意潜在的偏见,特别是对于可穿戴传感器。很多数据可能来自更富裕的地区。如果你只训练Apple Watch的数据,你是否得到了正确的人口组合?拥有不同年龄、不同性别、不同活动水平和不同合并症的大量人群数据将是很好的。
拥有这些数据你能做什么?
拥有3D模型的最新医学图像和连续、动态、高分辨率的传感器数据,我们可以弄清楚,例如:如果你在65岁时心脏病发作,那么在63岁时发生了什么?我们是否可以更积极地识别血流中的某些细微差别?
几何结构在不同人之间真的很不同。你需要大量的数据才能弄清楚血流中的小差异是什么以及为什么它重要。
这种健康模拟的极限是什么?
我不认为有必要的极限——只是很多挑战。有很多我们可以结合的东西,比如神经系统和淋巴系统。我们希望整合来自许多不同系统的数据,但让它们在反馈回路中相互通信非常复杂。我认为我们会达到那个目标。这只是关于一个系统一个系统地添加。
本文译自 Quanta Magazine,由 BALI 编辑发布。