HyperAI超神经

推理时扩展 Inference-time Scaling

推理时扩展 (Inference-time Scaling) 是一种通过增加推理阶段的计算资源来提升大型语言模型 (LLMs) 性能的方法。 OpenAI 的 o1 系列模型率先引入了推理时扩展 (inference-time scaling) 的概念,通过增加思维链 (Chain-of-Thought) 推理过程的长度,在数学、编程、科学推理等任务上取得了显著的性能提升。

推理时扩展旨在通过在推理过程中分配额外计算资源(如更多的计算步骤、更复杂的推理策略等)评估多种结果,选择最佳方案来提升模型性能。它突破了传统仅依靠增加训练资源提升模型能力的局限,让模型在面对复杂任务时,能策略性思考和系统解决问题。