走进科学
新算法剖析数据噪音,更好地预测临界点
无论您是想预测气候灾难还是心理健康危机,数学告诉我们要注意波动。
从野生动物数量到焦虑水平,数据中的变化可能是一个系统达到临界点的早期警告信号,在临界点,这些变化可能会加速甚至变得不可逆转。
但是哪些数据点最重要?哪些只是噪音?
布法罗大学研究人员开发了一种新算法,可以识别最能预测临界点接近的数据点。该理论框架详细描述在《自然通讯》上,使用随机微分方程的强大功能来观察数据点或节点的波动,然后确定哪些应该用于计算早期预警信号。
模拟证实,该方法比随机选择节点更准确地预测了理论临界点。
这项研究的首席作者、纽约大学数学系的Naoki Masuda博士表示:“每个节点都有一定的噪音——换句话说,它会随时间变化,但当临界点临近时,有些节点可能会比其他节点更早且更剧烈地变化。选择正确的节点集合可能会提高早期预警信号的质量,同时帮助我们避免浪费资源观察无信息量的节点。”
该研究的合著者包括数学系的博士后研究员Neil Maclaren和东京大学国际神经智能研究中心执行理事Kazuyuki Aihara。
这个算法的独特之处在于它完全将网络科学纳入到了过程中。Masuda表示,尽管早期预警信号已经在过去20年中应用于生态学和心理学领域,但很少有研究关注这些信号在网络内部如何连接。
以抑郁症为例。最近的研究将其和其他心理障碍视为一种症状网络,通过创建反馈循环相互影响。食欲不振可能意味着未来近期将出现其他五种症状,取决于这些症状在网络中的接近程度。
Masuda说:“作为一名网络科学家,我觉得网络科学可以提供一种独特的、甚至可能是改进的方法来处理早期预警信号。”
通过彻底将系统视为网络,研究人员发现,简单地选择波动最大的节点并不是最佳策略。这是因为一些选择的节点可能与其他选择的节点过于相关。
Masuda表示:“即使我们将两个具有良好早期预警信号的节点结合在一起,我们也不一定会得到更准确的信号。有时,将一个信号良好的节点与另一个信号质量中等的节点结合起来实际上会给我们带来更好的信号。”
尽管团队通过数值模拟验证了该算法,但他们表示,它可以直接应用于实际数据,因为它不需要关于网络结构本身的信息;它只需要确定网络系统的两种不同状态以确定最佳节点集合。
Masuda表示:“下一步将是与生态学家、气候科学家和医生等领域专家合作,进一步开发和测试该算法,并用他们的实证数据获得对他们问题的洞察。”