巨头布局世界模型:AI新赛道开启应对大模型增长瓶颈
随着大型语言模型(LLM)的发展逐渐趋于平稳,头部人工智能企业正将大量资金转向“世界模型”(World Models)的研发。这类模型旨在通过分析视频、机器人感知数据等多模态信息,让AI具备理解并自主导航物理世界的能力。 与传统LLM主要处理文本信息不同,世界模型试图构建对环境的动态认知,模拟因果关系、预测未来状态,从而支持机器人、自动驾驶和具身智能系统在真实世界中的决策与行动。这一方向被视为迈向通用人工智能(AGI)的关键一步。 目前,包括谷歌、Meta、OpenAI和特斯拉在内的多家科技巨头已加大投入。谷歌旗下DeepMind正在训练能从视频中推断物体运动规律的模型;Meta则在探索利用大规模视频数据构建环境表征;而特斯拉的Optimus人形机器人项目也依赖于自研世界模型来提升动作规划与环境适应能力。 尽管技术仍处早期阶段,但世界模型的潜力已引发广泛关注。研究者认为,只有当AI不仅能“理解语言”,还能“感知世界”并“与世界互动”,才真正具备迈向通用智能的基础。随着算力提升、数据积累和算法突破,世界模型正成为AI下一阶段竞争的核心战场。
