高科技
仿真计算突破:低功耗解决复杂方程
麻省大学阿默斯特分校的研究证明,忆阻器等模拟计算设备能高效处理复杂科学计算,且能显着降低功耗,有望克服数字计算的瓶颈。
一个300毫米的晶圆,具有数百个完全集成的忆阻器片上系统。每个芯片具有10个256×256的单管忆阻交叉阵列和片上外围电路。图片来源:TetraMem Inc.
麻省大学阿默斯特分校的工程师团队与其他研究人员合作,证明了一种名为忆阻器的模拟计算设备能够完成复杂的科学计算任务,同时绕过数字计算的限制。
利用复杂方程可以探索当今许多重要的科学问题,例如纳米材料建模和大规模气候科学。然而,用于执行这些计算的当今数字计算系统在速度、功耗和基础设施方面正接近其极限。
该研究成果发表在《科学》杂志上,麻省大学阿默斯特分校电气和计算机工程教授、论文通讯作者之一的Qiangfei Xia解释说,使用当前的计算方法,每次想要存储信息或给计算机分配任务时,都需要在内存和计算单元之间移动数据。对于复杂任务而言,处理更大数据量时,本质上会导致某种处理“瓶颈”。
传统计算解决这个问题的一种方法是增加带宽。夏教授及其来自麻省大学阿默斯特分校、南加州大学和计算技术制造商 TetraMem Inc. 的同事们则另辟蹊径,采用基于忆阻器的存内计算模拟技术来避免这些瓶颈,从而减少数据传输次数。
该团队的存内计算依赖于一种称为忆阻器的电气组件,它是存储器和电阻 (控制电路中的电流流动) 的结合体。忆阻器既能控制电路中的电流流动,又能“记住”先前的状态,即使断电后也能记住,这一点不同于当今基于晶体管的计算机芯片,后者只有在通电时才能保存信息。忆阻器设备可以编程为多种电阻水平,从而增加单个存储单元的信息密度。
当组织成交叉阵列时,这种忆阻器电路通过大规模并行的方式利用物理定律进行模拟计算,大大加速了矩阵运算,这是神经网络中最常用但也非常耗电的计算。计算在器件处执行,而不是在内存和处理单元之间移动数据。用交通类比来解释,Xia教授将存内计算比作疫情高峰期几乎空旷的道路:“你消除了交通拥堵,因为 (几乎) 所有的人都居家办公。我们同时工作,但只发送重要的数据/结果。”
之前,这些研究人员证明了他们的忆阻器可以完成低精度的计算任务,例如机器学习。其他应用还包括模拟信号处理、射频感应和硬件安全。
Xia教授说:“在这项工作中,我们提出并展示了一种新型的电路架构和编程协议,它可以通过使用多个相对低精度的模拟器件 (例如忆阻器) 的加权和来高效表示高精度数字,与现有的量化方法相比,大大降低了电路、功耗和延迟的开销。”
“这篇论文的突破之处在于我们进一步拓展了边界,” 他补充说, “这项技术不仅适用于低精度的神经网络计算,而且也适用于高精度科学计算。”
作为原理性验证,该忆阻器解决了静态和时变偏微分方程、Navier-Stokes 方程和磁流体动力学问题。
“我们突破了自己的舒适区,” 他说道,将研究扩展到超越边缘计算神经网络的低精度需求,进军高精度科学计算领域。
麻省大学阿默斯特分校团队及其合作伙伴花了十多年时间设计合适的忆阻器设备并构建用于模拟存内计算的大型电路和计算机芯片。“我们过去十年的研究使模拟忆阻器成为一项可行的技术。现在是时候将这项伟大技术推向半导体行业,让更广泛的人工智能硬件社区从中受益,” 夏教授说。
本文译自 UMass Amherst,由 BALI 编辑发布。