
要約
近年、大規模言語モデル(LLM)の進展は顕著な成果を上げているものの、複雑な問題を解く能力には依然として限界がある。本研究では、人間の思考プロセスに類似した累積的かつ反復的なアプローチとして、累積的推論(Cumulative Reasoning, CR)を提案する。CRはタスクを小さな管理可能な要素に分解し、過去の推論結果を有効に組み合わせることで、問題解決能力を著しく向上させる。実験により、複数の複雑な推論タスクにおいてCRの優位性を示した。論理的推論タスクでは、既存手法を最大9.3%上回り、カスタマイズされたFOLIO wikiデータセットにおいて98.04%の精度を達成した。24ゲームでは98%の精度を記録し、従来の最良手法に対して24%の改善を実現した。MATH問題の解決においては、前例比で4.2%の向上を達成し、特に難易度5(最難関)の問題では相対的に43%の改善を示した。さらに、CRにコード実行環境を統合した場合、LLMの推論能力をさらに発揮し、Thought Program(PoT)手法を38.8%上回る性能を達成した。コードはGitHubにて公開されている:https://github.com/iiis-ai/cumulative-reasoning。