HyperAI超神经
Back to Headlines

Meta AI科学家Yann LeCun:当前模型需突破四大关键人类特质以实现真正智能

4 days ago

Meta的首席AI科学家Yann LeCun在巴黎的人工智能行动峰会上表示,当前的人工智能模型缺乏四个关键的人类特质,这要求对其训练方式进行重大调整。LeCun与IBM的AI领袖Anthony Annunziata探讨了这一话题。他认为,所有相对聪明的生物(包括人类)的智能行为都有四个基本特征:理解物理世界、具有持久记忆能力、能够推理和规划复杂行动。然而,目前的人工智能模型,尤其是大型语言模型(LLM),还未能达到这些标准。 LeCun指出,许多大公司正在通过拼凑现有技术来提升AI的能力,但这些方法只是临时解决方案。例如,为了使AI更好地理解物理世界,一些公司会单独训练一个视觉系统并将其添加到大型语言模型中;为了加强AI的记忆能力,它们会使用检索增强生成(RAG)或其他类似的技术。然而,LeCun认为这些做法更像是“修补”,真正的突破需要从根本上改变AI的训练方式。 为了解决这一问题,LeCun提出了“基于世界的模型”(world-based models)的概念。这类模型在真实场景中进行训练,从而具备更高层次的认知能力。根据LeCun的定义,这种模型可以根据当前的世界状态预测某个动作将导致的未来世界状态变化。然而,由于现实世界的复杂性和不可预测性,训练这类模型的关键在于抽象化处理。Meta已经在进行相关实验,比如今年2月公开发布的一种非生成性模型V-JEPA,它通过预测视频中缺失或被遮盖的部分来进行学习。这种方法的核心在于训练系统生成视频的抽象表示,从而在这一抽象层面上做出预测,忽略那些无法预测的具体细节。 LeCun用化学家如何建立物质的基本层级结构作为类比,进一步解释了这一理念。化学家通过粒子、原子、分子和材料的分层抽象,学会了如何理解和分析物质世界。“每次上升一层,我们都会消除大量关于底层的信息,因为这些信息对于当前的任务来说并不重要。”LeCun表示,通过创建分层的抽象表示,AI可以更有效地理解和预测物理世界中的各种场景。 业内专家普遍认为,LeCun提出的“基于世界的模型”为AI的发展开辟了新的方向,有助于克服现有技术的局限性。Meta作为全球领先的社交巨头之一,在人工智能领域投入巨大,一直致力于前沿技术的研究和应用。随着这一概念的逐步探索和实践,未来AI在认知和理解物理世界方面的能力有望得到显著提升。

Related Links