Meta 发布 V-JEPA 2:更快的 AI 模型助力机器人理解物理世界
Meta 在周三发布了新的 V-JEPA 2 AI 模型,这是一个旨在帮助 AI 代理理解周围世界的“世界模型”。V-JEPA 2 是 Meta 去年发布的 V-JEPA 模型的升级版,训练数据来自超过 100 万小时的视频。这些视频训练使得 AI 代理能够更好地在物理世界中操作,理解并预测自然规律如重力如何影响接下来的事件序列。 这一模型的创新之处在于模拟了儿童和动物大脑的发展过程,让 AI 具备了某种形式的常识推理能力。例如,当你和狗玩接飞盘游戏时,狗会理解扔出去的飞盘会在碰到地面后反弹,而它需要跑到预计飞盘落地的位置,而不是当前位置去追飞盘。类似的,Meta 展示了一些案例,比如一个机器人手持锅铲和盘子,走向装有煎蛋的炉子,AI 可以预测下一个合理的动作是使用锅铲将煎蛋移动到盘子上。 V-JEPA 2 的性能表现尤为突出,Meta 宣称其速度相比 Nvidia 的 Cosmos 模型快了 30 倍。不过,Meta 和 Nvidia 使用的评估标准可能不同,因此这一比较需要谨慎对待。Meta 的首席人工智能科学家 Yann LeCun 在一段视频中表示:“我们认为世界模型将开启一个新的机器人时代,使现实世界的 AI 代理能够在不需要天文数字般的训练数据的情况下,帮助人们完成家务和其他物理任务。” Meta 此次发布的新模型不仅展现了其在 AI 研究领域的领先地位,也预示着未来 AI 代理在现实生活中的应用潜力巨大。例如,智能家居产品可能会变得更加智能,能够理解和预测用户的动作,从而更有效地提供帮助。尽管 V-JEPA 2 的发布令人鼓舞,但仍有专业人士指出,要在实际环境中大规模应用这种模型,还需要解决一系列技术和伦理问题。例如,如何确保 AI 代理在操作过程中不会引发安全问题,以及如何保护用户隐私。 Meta 是全球领先的社交和技术公司之一,近年来在 AI 领域投入大量资源。Yann LeCun 曾是深度学习领域的奠基人之一,他的工作为许多现代 AI 技术的发展奠定了基础。此次 V-JEPA 2 的发布再次证明了 Meta 在推动 AI 科技进步方面的决心和实力。