ReAct 框架

ReAct 框架是由普林斯顿大学和 Google Research 的姚顺雨等人于 2022 年在论文「REACT:SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS」中提出,该研究提出了一种通用范式,将推理和行动的进步结合起来,使语言模型能够解决各种语言推理和决策任务。研究证明,在提示更大的语言模型和微调较小的语言模型时,Reason+Act (ReAct) 范式系统地优于仅推理和行动的范式。推理和行动的紧密结合还呈现出与人类一致的任务解决轨迹,从而提高了可解释性、可诊断性和可控制性。

ReAct 使语言模型能够以交错方式生成口头推理轨迹和文本动作。虽然动作会导致来自外部环境的观察反馈,但推理轨迹不会影响外部环境。相反,它们通过推理上下文并使用有用的信息更新模型来影响模型的内部状态,以支持未来的推理和行动。

ReAct 是一种简单而有效的方法,用于协同语言模型中的推理和行动。研究团队通过专注于多跳问答、事实核查和交互式决策任务的各种实验,表明 ReAct 具有可解释的决策轨迹,可带来卓越的性能。

ReAct 证明了在语言模型中联合建模思维、行为和环境反馈的可行性,使其成为能够解决需要与环境交互的任务的多功能代理。