HyperAI超神经

最近，顶级人工智能研究人员开始指出，仅依靠语言的局限性正促使他们探索一种全新的模型——“世界模型”。这种新模型试图超越现有的大型语言模型，通过模拟人类对周围世界的认知来预测事件，而不仅仅基于训练数据中的词汇和短语之间的统计关系。这一研究领域的引领者包括著名的斯坦福大学教授李飞飞和Meta公司的首席人工智能科学家扬·勒昆等。李飞飞长期致力于AI的创新研究，特别是在2010年推出ImageNet项目后声名大噪。现在，她正在通过自己于2024年初共同创立的世界实验室（World Labs）开发这种“世界模型”。这家初创公司获得了来自安德森霍洛维茨、恩颐投资和激进风险投资等知名风投机构的2.3亿美元初期融资。世界实验室在其网站上表示，“我们的目标是将AI模型从二维像素层面提升到完整的三维世界——包括虚拟世界和现实世界，赋予它们与我们相同的空间智能。”李飞飞在接受播客 interview（访谈名为No Priors）时详细阐述了这一点，她认为空间智能涵盖理解、推理、互动和生成三维世界的能力，这对于AI的发展至关重要。与李飞飞类似，Meta公司的首席AI科学家扬·勒昆也在带领一个小团队开发类似的项目。他们在巴黎举行的人工智能行动峰会上透露，该团队正利用视频数据训练模型，并进行多层抽象模拟。“我们的基本思路是不在像素级别进行预测，而是训练系统运行视频的抽象表征，这样一来，在这个抽象表征中预测变化就成为可能，同时也有望消除无法预测的细节。”勒昆在峰会上表示。这种抽象的方法简化了构建轨迹所需的要素，从而使预测世界特定时刻的变化变得更加容易。李飞飞和勒昆一致认为，开发这种“世界模型”是实现真正智能AI的关键步骤。勒昆指出，“我们需要能够快速学习新任务的AI系统，这些系统不仅要理解文本和语言，还要理解物理世界，具备常识以及推理和规划的能力，拥有持久的记忆。”而这一切，传统的大语言模型难以实现。构建有效的“世界模型”的主要障碍在于缺乏足够的数据。与语言不同，人类对三维空间的感知和记录并没有那么成熟和完善。因此，为了收集训练模型所需的数据，研究团队需要更先进的数据工程技术、数据获取方式、数据处理方法以及数据合成技术。“要求你闭上眼睛画出或构建周围的三维环境模型，这并不简单，”李飞飞在No Priors播客中说，“除非我们接受训练，否则我们很难生成极其复杂的模型。” 业内人士普遍认为，这一新型模型可能会引领AI技术的未来，尤其在创意领域、机器人技术甚至军事应用等方面有巨大潜力。世界实验室等项目的进展不仅代表了AI研究的重要突破，也为其他相关领域的创新提供了新思路。目前，包括Meta、Anduril等在内的科技巨头都在积极涉足这一领域，预示着一个崭新而充满挑战的时代的到来。李飞飞与勒昆的研究，进一步强化了人工智能朝着更高层次认知发展的趋势，这不仅是技术上的进步，更是对人类智能本质的一次深刻探讨。

相关链接

相关链接

相关链接

20 秒完成 15 天预报，欧洲科研团队提出高分辨率区域海洋预报模型 SeaCast

20 秒完成 15 天预报，欧洲科研团队提出高分辨率区域海洋预报模型 SeaCast

Command Palette

顶尖AI专家李飞飞和杨立昆正研发超越语言的新“世界模型”

相关链接

Command Palette

顶尖AI专家李飞飞和杨立昆正研发超越语言的新“世界模型”

相关链接

Command Palette

顶尖AI专家李飞飞和杨立昆正研发超越语言的新“世界模型”

相关链接

20 秒完成 15 天预报，欧洲科研团队提出高分辨率区域海洋预报模型 SeaCast

20 秒完成 15 天预报，欧洲科研团队提出高分辨率区域海洋预报模型 SeaCast