16 天前

基于大语言模型的推理自动模型选择

James Xu Zhao, Yuxi Xie, Kenji Kawaguchi, Junxian He, Michael Qizhe Xie
基于大语言模型的推理自动模型选择
摘要

思维链(Chain-of-Thought, CoT)与程序辅助语言模型(Program-Aided Language Models, PAL)代表了两种不同的推理范式,各具优势。CoT 采用自然语言进行推理,具有高度的灵活性与可解释性;而 PAL 则借助编程语言,能够实现更为结构化和严谨的逻辑推导。本文提出一种模型选择机制,通过引入大语言模型(Large Language Model, LLM)动态决策在 CoT 与 PAL 之间进行选择,从而融合二者的优势。理论分析表明该方法具备可行性,实验结果进一步验证了其有效性。在 Codex、ChatGPT 与 GPT-4 上,所提出的方法在八个推理数据集上均实现了显著的性能提升。此外,该方法与自一致性(self-consistency)策略具有良好的互补性:二者结合后不仅进一步提升了性能,还大幅降低了计算开销。值得一提的是,我们在 GSM8K 和 SVAMP 数据集上取得了新的最先进(state-of-the-art)结果,准确率分别达到 96.8% 和 93.7%。相关代码、数据及提示模板已开源,详见:https://github.com/XuZhao0/Model-Selection-Reasoning。