HyperAI超神经
Back to Headlines

顶尖AI专家李飞飞和杨立昆正研发超越语言的新“世界模型”

10 days ago

最近,顶级人工智能研究人员开始指出,仅依靠语言的局限性正促使他们探索一种全新的模型——“世界模型”。这种新模型试图超越现有的大型语言模型,通过模拟人类对周围世界的认知来预测事件,而不仅仅基于训练数据中的词汇和短语之间的统计关系。这一研究领域的引领者包括著名的斯坦福大学教授李飞飞和Meta公司的首席人工智能科学家扬·勒昆等。 李飞飞长期致力于AI的创新研究,特别是在2010年推出ImageNet项目后声名大噪。现在,她正在通过自己于2024年初共同创立的世界实验室(World Labs)开发这种“世界模型”。这家初创公司获得了来自安德森霍洛维茨、恩颐投资和激进风险投资等知名风投机构的2.3亿美元初期融资。世界实验室在其网站上表示,“我们的目标是将AI模型从二维像素层面提升到完整的三维世界——包括虚拟世界和现实世界,赋予它们与我们相同的空间智能。”李飞飞在接受播客 interview(访谈名为No Priors)时详细阐述了这一点,她认为空间智能涵盖理解、推理、互动和生成三维世界的能力,这对于AI的发展至关重要。 与李飞飞类似,Meta公司的首席AI科学家扬·勒昆也在带领一个小团队开发类似的项目。他们在巴黎举行的人工智能行动峰会上透露,该团队正利用视频数据训练模型,并进行多层抽象模拟。“我们的基本思路是不在像素级别进行预测,而是训练系统运行视频的抽象表征,这样一来,在这个抽象表征中预测变化就成为可能,同时也有望消除无法预测的细节。”勒昆在峰会上表示。这种抽象的方法简化了构建轨迹所需的要素,从而使预测世界特定时刻的变化变得更加容易。 李飞飞和勒昆一致认为,开发这种“世界模型”是实现真正智能AI的关键步骤。勒昆指出,“我们需要能够快速学习新任务的AI系统,这些系统不仅要理解文本和语言,还要理解物理世界,具备常识以及推理和规划的能力,拥有持久的记忆。”而这一切,传统的大语言模型难以实现。 构建有效的“世界模型”的主要障碍在于缺乏足够的数据。与语言不同,人类对三维空间的感知和记录并没有那么成熟和完善。因此,为了收集训练模型所需的数据,研究团队需要更先进的数据工程技术、数据获取方式、数据处理方法以及数据合成技术。“要求你闭上眼睛画出或构建周围的三维环境模型,这并不简单,”李飞飞在No Priors播客中说,“除非我们接受训练,否则我们很难生成极其复杂的模型。” 业内人士普遍认为,这一新型模型可能会引领AI技术的未来,尤其在创意领域、机器人技术甚至军事应用等方面有巨大潜力。世界实验室等项目的进展不仅代表了AI研究的重要突破,也为其他相关领域的创新提供了新思路。目前,包括Meta、Anduril等在内的科技巨头都在积极涉足这一领域,预示着一个崭新而充满挑战的时代的到来。李飞飞与勒昆的研究,进一步强化了人工智能朝着更高层次认知发展的趋势,这不仅是技术上的进步,更是对人类智能本质的一次深刻探讨。

Related Links