ReAct フレームワークは、プリンストン大学と Google Research の Yao Shunyu らによって、論文「」で開発されました。React: 言語モデルでの推論と行動の相乗効果「この研究は、言語モデルがさまざまな言語推論と意思決定タスクを解決できるようにする推論とアクションの進歩を組み合わせた一般的なパラダイムを提案します。」研究によると、Reason+Act (ReAct) パラダイムは、より大きな言語モデルをプロンプトし、より小さな言語モデルを微調整する場合に、推論とアクションのみのパラダイムより体系的に優れていることが実証されています。また、推論と行動が緊密に統合されることで、人間と一致するタスク解決の軌道が示され、それによって説明可能性、診断可能性、および制御可能性が向上します。
ReAct を使用すると、言語モデルが口頭推論の軌道とテキストのアクションをインターリーブ方式で生成できるようになります。行動は外部環境からの観察フィードバックをもたらしますが、推論の軌跡は外部環境に影響を与えません。代わりに、コンテキストについて推論し、将来の推論とアクションをサポートする有用な情報でモデルを更新することによって、モデルの内部状態に影響を与えます。
ReAct は、言語モデルで推論とアクションを連携させるためのシンプルかつ効果的な方法です。研究チームは、マルチホップの質問応答、ファクトチェック、インタラクティブな意思決定タスクに焦点を当てたさまざまな実験を通じて、ReAct には優れたパフォーマンスにつながる解釈可能な意思決定の軌跡があることを示しました。
ReAct は、言語モデルで思考、行動、および環境フィードバックを共同でモデル化する実現可能性を実証し、環境との対話を必要とするタスクを解決できる多用途エージェントになります。