HyperAIHyperAI

Command Palette

Search for a command to run...

思维链提示在大型语言模型中激发推理能力

Jason Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter Fei Xia Ed Chi Quoc Le Denny Zhou

摘要

我们探讨了通过生成思维链——即一系列中间推理步骤——如何显著提升大型语言模型执行复杂推理的能力。特别地,我们展示了在足够大的语言模型中,仅通过一种称为“思维链提示”(chain of thought prompting)的简单方法,便可自然地涌现出此类推理能力:即在提示中提供少量思维链示范作为示例。在三个大型语言模型上的实验表明,思维链提示显著提升了模型在算术推理、常识推理和符号推理等多种任务上的表现。其实际性能提升尤为显著:例如,仅使用八个思维链示例对一个参数规模达5400亿的语言模型进行提示,即可在数学应用题基准测试GSM8K上达到当前最优水平,甚至超越经过微调且配备验证器的GPT-3模型。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供