1 个月前

评估机器中适应性世界模型的新游戏方法

Lance Ying, Katherine M. Collins, Prafull Sharma, Cedric Colas, Kaiya Ivy Zhao, Adrian Weller, et al
评估机器中适应性世界模型的新游戏方法
摘要

人类智能展现出在新奇和陌生环境中快速适应和有效解决问题的显著能力。我们认为,这种深刻的适应性从根本上与环境内部表示(即世界模型)的有效构建和精炼密切相关,并将这种适应机制称为世界模型归纳。然而,当前对人工智能(AI)中世界模型的理解和评估仍然较为狭隘,通常关注从大量数据训练中学到的静态表示,而忽视了模型通过在新环境中互动和探索来学习这些表示的效率和效果。在本文中,我们借鉴认知科学数十年的研究成果,提供了关于人类如何高效学习和适应的世界模型归纳观点;随后呼吁建立一个新的评估框架,以评估AI中的自适应世界模型。具体而言,我们提出了一种基于精心设计的游戏套件的新基准测试范式,这些游戏在其底层结构中具有真实、深刻且不断更新的新颖性——我们将这类游戏称为新颖游戏。我们详细阐述了构建这些游戏的关键需求,并提出了适当的指标来明确挑战和评估代理在快速世界模型归纳方面的能力。我们希望这一新的评估框架能够激发未来对AI中世界模型的评估努力,并为开发具备类似人类快速适应能力和强大泛化能力的AI系统提供关键一步——这是实现人工通用智能的重要组成部分。