5 个月前

监督式微调

自然语言处理

Samuel Lewis-Lim Xingwei Tan Zhixue Zhao Nikolaos Aletras

摘要

近期研究表明，链式思维（Chain-of-Thought, CoT）在诸如分析性推理和常识推理等软性推理任务中往往带来的提升有限。此外，CoT 有时也未能真实反映模型实际的推理过程。本文针对指令微调模型、推理模型以及推理蒸馏模型，在软性推理任务中系统研究了 CoT 的动态特性及其忠实度。研究发现，不同模型依赖 CoT 的方式存在显著差异，且 CoT 的影响程度与其实现的忠实度并不总是一致。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

思维链动态分析：主动引导还是不忠实的事后合理化？ | 论文 | HyperAI超神经