李飞飞重磅发声:AGI是营销噱头,空间智能才是AI突破的关键
李飞飞在最新播客访谈中深入阐述了她对人工智能未来的思考,明确指出“通用人工智能”(AGI)更像一个营销概念而非科学目标,真正亟待突破的是空间智能——人类在三维世界中感知、推理与操控物体的核心能力。她认为,当前大语言模型虽能流畅对话,却缺乏对物理世界的理解,无法完成如数清椅子数量、预测物体运动等基础空间任务,本质上仍是“黑暗中的文字匠人”。 回顾AI发展历程,李飞飞强调,2012年ImageNet数据集的诞生是现代AI的起点。她当年主导构建的1500万张图片与2.2万个类别,为深度学习提供了关键训练原料,奠定了“大数据+神经网络+算力”的黄金公式。然而,如今这一模式已触及瓶颈——语言模型无法落地现实世界,尤其在机器人领域表现乏力。 她指出,机器人面临的挑战远超语言模型:训练数据缺失三维动作信息,模型输出难以匹配物理规律,且现有系统将空间信息简化为二维或一维序列,严重扭曲了真实世界的结构。这正是她转向“世界模型”的动因。2024年,她联合创办的World Labs发布了全球首个生成式三维世界模型Marble,具备生成几何与物理一致的可交互三维世界的能力,支持自由导航、多模态输入与动态预测。 Marble已展现出广泛潜力:影视公司用它将虚拟制作效率提升40倍;游戏开发者将其用于VR场景构建;心理学团队借此创建沉浸式实验环境研究精神疾病;机器人研究者则利用其生成海量合成训练数据,解决现实场景稀缺难题。甚至有人设想将其用于暴露疗法治疗恐高症。 李飞飞强调,仅靠“苦涩教训”——即简单模型+海量数据——无法解决机器人问题。因为AI不仅需要“大脑”,更需“身体”与“环境”的深度融合。她以自动驾驶为例,虽已实现二维路径规划,但真正复杂的三维交互(如抓取、推拉、避障)仍远未突破。 她对AGI持审慎态度,认为该术语缺乏清晰定义,且当前技术距离实现人类级的科学发现或情感理解仍遥不可及。她以DeepMind提出的“能否从19世纪末数据中推导出爱因斯坦理论”为例,指出AI连基本物理规律的推导都难以完成。 最后,她重申AI的终极归宿是“以人为本”。无论你是教师、护士、农民还是艺术家,AI时代你都有不可替代的角色。技术不应削弱人的尊严,而应增强人的能动性。她呼吁每个人关注AI,因为它的未来,由我们共同塑造。
