思维链 Chain of Thought

思维链(Chain of Thought,简称 CoT)是一种在大型语言模型中增强逻辑推理能力的技术。这一概念最初由谷歌大脑的高级研究员 Jason Wei 提出,并在 2022 年 1 月发表的论文「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」中进行了详细阐述。 CoT 技术通过将复杂问题分解为一系列逐步的子问题解答,引导模型生成详细的推理过程,从而提高模型在算术推理、常识推理和符号推理等复杂任务上的表现。

CoT 技术的关键优势在于其能够显著提升模型的可解释性,并帮助模型进行复杂的逻辑推理,尤其是在需要组合多个事实或信息片段的问题上。它模仿了人类的推理过程,即通常不是直接得出答案,而是通过一系列的思考、分析和推理步骤。 CoT 方法分为基于人工示例标注的 Few-shot CoT 和无人工示例标注的 Zero-shot CoT 两种形式。 Few-shot CoT 通过提供少量示例来展示推理过程,而 Zero-shot CoT 则通过特定的提示(如「Let’s think step by step」)来激发模型生成推理链条,无需额外的示例。