HyperAI超神经
Back to Headlines

英伟达新推Cosmos-Reason1模型:AI物理理解能力大幅提升

17 days ago

近日,全球领先的图形处理技术和人工智能解决方案提供商英伟达发布了一款名为 Cosmos-Reason1 的新型人工智能模型,旨在帮助 AI 更好地理解和应对物理世界。此前,尽管 AI 在语言处理、数学计算和代码生成等方面取得了重大突破,但在实际物理环境中的表现却令人失望,尤其是在机器人和自动驾驶车辆等涉及物理常识和具身推理的任务中,AI 往往无法直观理解诸如重力或空间关系等基本物理概念。 为解决这一难题,英伟达推出了 Cosmos-Reason1 系列模型,包括 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两种不同规模的版本。此模型采用了一种创新的双本体系统,其中一个分层本体将物理常识分为三大类:空间关系、时间概念和基础物理知识;另一个本体则专注于提升不同类型具身代理(如人类、机械臂和人形机器人)的推理能力。此外,模型采用了仅解码器的大规模语言架构,并集成了视觉编码器,能够同时处理文本和视频数据,从而更准确地模拟物理世界。 为了训练这一模型,英伟达的研究团队精心设计了两类基准测试:一类专门针对物理常识,包含604个问题和426个视频;另一类则侧重于评估具身推理的表现,含有610个问题和600个视频。这些基准不仅覆盖了多种物理情景,还囊括了多样化的任务类型,确保模型能够在广泛的实际应用场景中展现其潜力。结果显示,经过物理 AI 监督微调和强化学习训练后,Cosmos-Reason1 系列模型在预测物体动作、判断任务执行情况以及评估物理可行性的任务上均取得了显著进步。尤其值得一提的是,强化学习训练进一步放大了模型的能力,使其在这些测试中获得了更加出色的表现。 英伟达的 Cosmos-Reason1 模型不仅仅是一项技术上的突破,更为重要的是,它为解决物理 AI 的发展障碍提出了一条切实可行的道路。通过引入更具针对性的训练数据和先进的模型架构,该系列模型有望在未来推动机器人和自动驾驶技术向更高层次迈进。目前, Cosmos-Reason1 模型已经在 GitHub 上开源,以便更多的研究者和开发者参与进来,共同促进这一领域的快速发展。

Related Links