研究表明 AI 语言模型在基础层面能理解现实世界
布朗大学最新研究发现,人工智能语言模型在某种程度上确实“理解”现实世界。这项题为《这仅仅是幻想吗?语言模型表征反映人类对事件合理性的判断》的研究将由研究人员在巴西里约热内卢举行的国际学习表征会议上公布,并发表于 arXiv 预印本服务器。 研究核心在于探讨 AI 模型是否能像人类一样区分常见、不可能、荒谬或极不可能的事件。研究团队通过机制可解释性方法,深入分析了 GPT-2、Llama 3.2 和 Gemma 2 等多个开源模型的内部数学状态。他们向模型输入了描述不同情境的句子,例如“用冰冷却饮料”(常见)、“用雪冷却饮料”(极不可能)、“用火冷却饮料”(不可能)以及“用昨天冷却饮料”(无意义)。 结果显示,参数量超过二十亿的模型能够形成独特的数学向量,这些向量与事件的合理性类别高度相关。模型不仅能区分明显不同的类别,甚至能以约 85% 的准确率区分“极不可能”与“不可能”这类细微差别。更令人惊讶的是,这些向量还反映了人类对模糊情境的不确定性。例如,当人类对“用帽子清洁地板”这一说法的合理性存在分歧时,AI 模型输出的概率分布与人类调查结果惊人地一致。 研究负责人迈克尔·莱波里指出,这表明现代 AI 模型已编码了类似现实世界的因果约束,且其判断逻辑可预测人类的主观认知。随着模型规模从二十亿参数增长到如今的上万亿参数,这种“理解”能力愈发显著。研究人员表示,此类机制研究有助于揭示 AI 的学习机制,为开发更智能、更可信的模型提供关键依据。
