人工智能
药物发现平台:基于代数拓扑学的化合物数据分析方法
德克萨斯大学达拉斯分校UTD和诺华Novartis制药公司的研究人员设计了一个基于拓扑数据分析的药物发现平台,可以使药物研发过程更有效、更具成本效益。
达拉斯德州大学数学科学教授 Baris Coskunuzer 博士和同事开发了一种基于拓扑数据分析的方法,以虚拟方式筛选数千种可能的候选药物,并将候选化合物的大幅缩小至最适合实验室和临床测试的范围。
研究人员将在11月28日至12月9日在新奥尔良举行的第 36 届神经信息处理系统会议上展示他们的发现。
通常,药物发现的早期阶段涉及研究员辨识生物靶标,例如与感兴趣的疾病相关的蛋白质。下一步是筛选数以千计的潜在化合物,这些化合物可能有效或可以被修改以影响目标以靶向疾病的原因或症状。最有前途的候选物质将进入漫长而昂贵的实验和临床测试流程,以及监管批准过程。
“药物发现过程可能需要 10 到 15 年,耗资 10 亿美元,”Coskunuzer 说。 “制药公司想要一种更具成本效益的方法来做到这一点。他们希望在流程开始时找到最有前途的化合物,这样他们就不会浪费时间。我们提供了一种全新的虚拟筛选方法,计算效率高,并根据化合物起作用的可能性对化合物进行排名。”
虽然化合物库的虚拟筛选并不新鲜,但 Coskunuzer 表示,他们团队的方法在大型数据集上明显优于当前最先进的技术。
UTD和Novartis团队将虚拟筛选过程定义为一种新型的基于拓扑的图排名问题,来自被称为拓扑数据分析的数学分支。他们的方法根据其底层物理子结构的形状(其拓扑结构)以及分子组分的一系列物理和化学性质来表征每个分子化合物。根据这些信息,研究人员为每种化合物开发了一个独特的“拓扑指纹”,根据应用所需特性的程度对其进行排名。
“我们算法的优势在于它可以在几天内筛选出大约 100000 种化合物,这比其他方法快得多。”Coskunuzer 说。
下一步将是推广分子特性预测,包括对化合物在水中的溶解度等指标进行评分。溶解度对药物疗效至关重要。
“如果你找到了一种好的化合物,但它不具有所需的分子特性——如不可溶——那即便就没有多少价值。你肯定希望能够在投入太多测试成本之前提前预知到这些特性。”
https://phys.org/news/2022-11-math-approach-drug-discovery-effective.html