2 个月前

通用智能体

Scott Reed; Konrad Zolna; Emilio Parisotto; Sergio Gomez Colmenarejo; Alexander Novikov; Gabriel Barth-Maron; Mai Gimenez; Yury Sulsky; Jackie Kay; Jost Tobias Springenberg; Tom Eccles; Jake Bruce; Ali Razavi; Ashley Edwards; Nicolas Heess; Yutian Chen; Raia Hadsell; Oriol Vinyals; Mahyar Bordbar; Nando de Freitas
通用智能体
摘要

受大规模语言模型进展的启发,我们采用类似的方法构建了一个超越文本输出领域的单一通用代理。该代理被称为Gato,其工作方式为多模态、多任务、多实体的通用策略。同一网络使用相同的权重可以玩Atari游戏、为图像添加标题、进行对话、用真实的机械臂堆叠积木等更多任务,根据上下文决定输出文本、关节扭矩、按钮按下或其他标记。在本报告中,我们将描述该模型及其数据,并记录Gato当前的能力。