可逆计算:人工智能节能的新希望
对于Michael Frank来说,效率一直都是他主要的关注点。在上世纪90年代作为学生时,他对人工智能产生了浓厚兴趣。但当意识到这项技术可能消耗大量能源后,他的研究方向转向了探索计算的物理极限:“你能建造出最高效的计算机是什么样的?”不久之后,他找到了一种利用热力学特性的设备——一个能够像向前运行一样向后运行的“可逆计算机”。通过不删除数据,这种计算机可以避免浪费能源。 现代传统计算技术的进步正在放缓,新的芯片面临着无法变得更小的根本物理限制,而可逆计算有望在这种情况下继续推动计算进步。“其他提高能量的方法不多了,”Portland州立大学研究非传统计算方法的Christof Teuscher表示,“可逆计算是一种非常有益且令人兴奋的方式,可以潜在地节省几个量级的能源。” 早在1961年,IBM著名的物理学家Rolf Landauer就揭示了信息丢失与热量产生的关系。当计算机删掉信息时,其芯片中的电子会从已知路径变成未知路径,这些丢弃的电子的能量会转化为热量释放出来。Landauer证明,无论计算机如何设计,每次删除一个比特的信息都不可避免地会产生一定的热量。 Landauer曾认为可逆计算是一个死胡同,因为如果不删除数据,内存会被迅速填满,使计算机变得不可用。然而,他的年轻同事Charles Bennett在1973年提出了另一种办法——反运算(uncomputation)。Bennett的思路是,在进行计算后存储所需的结果,然后将计算过程逆转。这种方法虽然理论上能避免热量损失,但由于需要两倍的计算时间,实际操作中并不实用。 到了1990年代,MIT的一群工程师开始尝试从源头上设计低热量损耗的可逆计算机芯片。Frank于1995年加入这一团队,并成为可逆计算的主要支持者之一。然而,进入新千年之后,由于当时的普通芯片仍在指数级改善,可逆计算的研究受到了冷落,经费支持也变得稀少。 随着计算机电路尺寸不断缩小,它们接近了物理极限,传统技术的提升变得越来越困难。2022年,当时在剑桥大学工作的Hannah Earley发表了一项研究,详细分析了可逆计算机的效率。她发现尽管可逆计算机产生的热量比传统计算机少得多,但仍不可避免地会有热量产生。这是因为电压变化会导致金属发热,且电压变化越快,热量越大。可逆计算机运行得越慢,热量就越少,这种关系在AI计算中尤其有利。 在AI计算中,经常有多处理器并行执行不同的计算任务。如果可逆芯片运行速度较慢,但通过增加芯片数量来补偿,最终会节省总体能耗。此外,缓慢运行的芯片减少冷却需求,可以更紧密地堆放在一起,节省空间、材料和数据传输时间。 投资界已经开始关注这一领域。Earley与Frank合作创立了Vaire Computing,致力于开发可逆芯片的商业版本。在数十年的理论研究后,哥本哈根大学的Torben Ægidius Mogensen认为,我们终于可能看到这一技术的实际应用。“最令人兴奋的是能够在实际中使用可逆处理器,”他说。 可逆计算的潜力不仅在于其节能效果,更重要的是它提供了一种突破传统计算物理限制的新途径。Frank的研究团队正在努力吸引行业和学术界的更多关注,希望这一创新能够在未来改变计算方式。虽然目前还处于早期阶段,但如果能够成功商业化,可逆计算有望对高性能计算尤其是AI领域带来革命性的变化。