HyperAI超神经
Back to Headlines

Meta推出V-JEPA 2新模型,加速机器人视觉理解训练

3 days ago

Meta近日推出了一款名为V-JEPA 2的人工智能模型,这款模型被设计用来帮助机器人和其他AI代理更好地理解周围的世界。这是对去年发布的V-JEPA模型的升级,旨在通过视频数据训练AI拥有类似儿童和动物的常识判断能力。V-JEPA 2的训练基于超过100万小时的视频资料和100万张图片,这些数据让AI能够预测如重力等物理原理如何影响物体接下来的行为模式,从而帮助机器人完成特定任务,例如捡球、使用铲子将煎蛋移到盘子里等。 Meta的技术团队在实验室中测试了新模型的功能,在一些常见的机器人任务上展示了其优势,比如搬运物品。通过视觉目标表示来指导机器人的动作,V-JEPA 2可以生成可能的动作选项,评估每个选项的结果,最后选择最适合的行动策略。在面对复杂挑战时,该模型则采用一系列视觉子目标来进行行为引导。测试表明,在未见过面的新环境里,V-JEPA 2成功完成了65%到80%的任务成功率。这种不依赖特定任务的大规模训练数据或是人类的直接指导就能实现的有效学习方式,对推动AI技术的发展有着重要意义。 Meta的首席人工智能科学家Yann LeCun表示,“我们认为世界模型将开启机器人领域的新纪元,使实际生活中的AI能够辅助人类完成日常家务和体力劳动,而无需庞大的机器人训练数据量。”不过,虽然V-JEPA 2相比之前的版本有了进步,但从与人类对比的表现来看,模型在处理此类基准测试时仍然存在差距。为了进一步提高V-JEPA 2的能力,Meta提出需要开发可以在多个时间尺度和感知方式上运作的模型,即融入声音和触感的信息处理机制。为此,Meta正在分享三个新的评测标准,以及将代码和模型参数对外公开,鼓励业界内外更广泛的探索和创新。 除了加速自身研究进程外,Meta也希望其他科技公司和研究机构能加入到这一领域的发展中来。目前,Google旗下的DeepMind团队也在构建能够模拟完整3D环境的世界模型Genie;此外,由知名AI教授Fei-Fei Li创立的初创企业World Labs筹集了2.3亿美元,致力于打造大型世界模型。这些迹象都显示着对增强AI物理世界应用能力的投资和技术兴趣正处于上升趋势。Meta希望通过共享V-JEPA 2的研究成果来激发更多相关的科研活动,促进整个行业的进步。 背景补充: Meta是一家总部位于美国的大型科技公司,以Facebook社交网络起家,近年来积极投身于AR/VR及人工智能领域的研发工作。此次推出的V-JEPA 2模型是其在AI领域的一个重要突破,特别是在物理世界理解和预测方面,这标志着机器学习技术正在向更为实用的方向迈进。业内人士认为,这类能够自学世界规则并且迅速适应新环境的AI代理,未来有可能成为家庭自动化和个人助理等领域的重要组成部分,对于减少劳动力成本,提高生活质量有着巨大潜力。

Related Links