NitroGen:面向通用游戏Agent的开源基础模型
NitroGen:面向通用游戏Agent的开源基础模型
Abstract
我们提出 NitroGen,这是一种面向通用游戏智能体的视觉-动作基础模型,其在超过1000款游戏的4万小时游戏视频数据上进行训练。该模型融合了三大核心要素:1)通过自动从公开可获取的游戏视频中提取玩家操作而构建的互联网规模视频-动作数据集;2)一个支持跨游戏泛化能力评估的多游戏基准测试环境;3)基于大规模行为克隆训练的统一视觉-动作模型。NitroGen 在多个不同领域展现出强大的能力,涵盖3D动作游戏中复杂的战斗对抗、2D平台游戏中高精度的操作控制,以及程序生成世界中的探索任务。该模型能够有效迁移至未见过的游戏环境,在任务成功率上相较从零开始训练的模型最高实现52%的相对提升。我们已公开发布该数据集、评估工具包及模型权重,以推动通用具身智能体领域的研究进展。
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.