走进科学
用类似瘟疫公司的程序来预测危险的啮齿动物
[-]
人家明明萌萌哒
来自北部的飞鼠看起来很萌,但是计算机模拟显示它可能是一些疾病的载体。
人畜共患的疾病爆发遵循一种令人担忧的传染模式:在某些情况下,当人们接触到携带病毒的动物,而这种病毒对人类生理环境兼容,那么这些人回到人类社会之后,疾病就会突然爆发,并快速传播开。而公共卫生组织观测到这种爆发之后的疾病,需要争分夺秒的寻找并确定疾病的最初来源和传播途径。
这有点像《瘟疫公司》中的一个场景。
通过计算机建模研究疾病爆发的研究人员希望通过建立相关的模型(其实也就是类似瘟疫公司的游戏)对相关的疾病进行疫情预测,并希望能够在未来用于防止在过去一年多在西非爆发的埃博拉疫情相关的情况再次发生。
疾病生态学家Barbara Han和她的同事通过大数据(Big Data)中的方法来检测动物中的疾病携带者-那些可能携带病毒和细菌,并能够交叉传染到人体-动物。在上周发布的相关研究中,科学家们统计了约2277中已知的啮齿类动物,并将相关信息输入到了计算机模型中,通过机器学习算法最终获得了约50多种潜在的疾病携带物种。
科学家们使用的相关的信息来自多个不同的信息源,如:大规模PanTHERIA 数据库,其中存储了哺乳动物物种的生理、行为、范围和社会结构等信息。这个数据库是从上千个独立领域研究信息辛苦收集而来的。
虽然PanTHERIA的编辑内容还不够全面,但是研究人员使用的电脑模型能够处理不完整的数据集,这也是采用机器学习的一种优势。“如果要等到万事俱备才开始,你就已经瘫痪了”,Han说。他们还利用公共卫生数据库中的能够携带交叉传染疾病的动物数据。研究人员首先使用了已知的啮齿动物的疾病来训练模型。算法会挑选出与疾病相关的特性参数,来标明这以物种会携带相关的病毒。
一旦模型建立了针对某种疾病携带的啮齿动物的“概要”信息,研究人员就会用这些“概要”去测试算法的区分性。目前的模型准确度在90%左右,这给予研究者相当的信心来标记其他未知的物种。测试最终通过识别出超过50多种不同的可能携带疾病的啮齿类物种,研究人员假设这些物种会有极高的概率携带某些疾病。他们的预测只是一个起点,还有很多不同的动物如蚱蜢和老鼠也也在我们的名单中。
该模型没有考虑物种之间的亲密性(也就是有交集的物种之间可能传播疾病)。Han说:“相反,最具传染性的特性是快速生活方式:快速成长,达到性成熟,然后繁殖,扩大种群数量。”
这有点嘲笑之前的相关研究——快节奏生长的物种和它们的免疫系统。这些物种能够充分利用自己的资源进行繁殖,所以为免疫系统投入能耗是十分低效的,这就使得他们会携带很多病毒。这些物种并不考虑如何抵抗病毒,而是生娃,生娃,如何生更多更多的娃……
这也给我们一些提示,需要提防那些生的快死的快的物种。