HyperAI超神经

Meta 在周三发布了新的 V-JEPA 2 AI 模型，这是一个旨在帮助 AI 代理理解周围世界的“世界模型”。V-JEPA 2 是 Meta 去年发布的 V-JEPA 模型的升级版，训练数据来自超过 100 万小时的视频。这些视频训练使得 AI 代理能够更好地在物理世界中操作，理解并预测自然规律如重力如何影响接下来的事件序列。这一模型的创新之处在于模拟了儿童和动物大脑的发展过程，让 AI 具备了某种形式的常识推理能力。例如，当你和狗玩接飞盘游戏时，狗会理解扔出去的飞盘会在碰到地面后反弹，而它需要跑到预计飞盘落地的位置，而不是当前位置去追飞盘。类似的，Meta 展示了一些案例，比如一个机器人手持锅铲和盘子，走向装有煎蛋的炉子，AI 可以预测下一个合理的动作是使用锅铲将煎蛋移动到盘子上。 V-JEPA 2 的性能表现尤为突出，Meta 宣称其速度相比 Nvidia 的 Cosmos 模型快了 30 倍。不过，Meta 和 Nvidia 使用的评估标准可能不同，因此这一比较需要谨慎对待。Meta 的首席人工智能科学家 Yann LeCun 在一段视频中表示：“我们认为世界模型将开启一个新的机器人时代，使现实世界的 AI 代理能够在不需要天文数字般的训练数据的情况下，帮助人们完成家务和其他物理任务。” Meta 此次发布的新模型不仅展现了其在 AI 研究领域的领先地位，也预示着未来 AI 代理在现实生活中的应用潜力巨大。例如，智能家居产品可能会变得更加智能，能够理解和预测用户的动作，从而更有效地提供帮助。尽管 V-JEPA 2 的发布令人鼓舞，但仍有专业人士指出，要在实际环境中大规模应用这种模型，还需要解决一系列技术和伦理问题。例如，如何确保 AI 代理在操作过程中不会引发安全问题，以及如何保护用户隐私。 Meta 是全球领先的社交和技术公司之一，近年来在 AI 领域投入大量资源。Yann LeCun 曾是深度学习领域的奠基人之一，他的工作为许多现代 AI 技术的发展奠定了基础。此次 V-JEPA 2 的发布再次证明了 Meta 在推动 AI 科技进步方面的决心和实力。

相关链接

相关链接

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

Command Palette

Meta 发布 V-JEPA 2：更快的 AI 模型助力机器人理解物理世界

相关链接

Command Palette

Meta 发布 V-JEPA 2：更快的 AI 模型助力机器人理解物理世界

相关链接

Command Palette

Meta 发布 V-JEPA 2：更快的 AI 模型助力机器人理解物理世界

相关链接

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

当多模态开始卷落地：MiniCPM-o-4.5 仅 9B 覆盖实时图像理解与文本生成；vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化