HyperAI超神经

PATS:过程级自适应思维模式切换

Wang, Yi ; Liu, Junxiao ; Zhang, Shimao ; Chen, Jiajun ; Huang, Shujian
发布日期: 5/27/2025
PATS:过程级自适应思维模式切换
摘要

当前的大规模语言模型(LLMs)通常对所有问题采取固定的推理策略,无论是简单的还是复杂的,而不考虑问题的难度。这种忽视任务和推理过程复杂度差异的做法导致了性能与效率之间的不平衡。现有的方法试图实现无需训练的快慢思维系统切换以应对不同难度的问题,但受到粗粒度解决方案级别策略调整的限制。为了解决这一问题,我们提出了一种新的推理范式:过程级自适应思考模式切换(Process-Level Adaptive Thinking Mode Switching, PATS),该范式使大规模语言模型能够根据每个步骤的难度动态调整其推理策略,从而优化准确性和计算效率之间的平衡。我们的方法将过程奖励模型(Process Reward Models, PRMs)与束搜索(Beam Search)相结合,引入了逐步模式切换和不良步骤惩罚机制。在多种数学基准测试中的实验表明,我们的方法在保持中等令牌使用量的同时实现了高精度。本研究强调了过程级、难度感知的推理策略适应的重要性,为大规模语言模型的有效推理提供了宝贵的见解。