2ヶ月前

SheetAgent: スプレッドシートの推論と操作を目的とした汎用エージェントの大規模言語モデルによる実現

Yibin Chen; Yifu Yuan; Zeyu Zhang; Yan Zheng; Jinyi Liu; Fei Ni; Jianye Hao; Hangyu Mao; Fuzheng Zhang
SheetAgent: スプレッドシートの推論と操作を目的とした汎用エージェントの大規模言語モデルによる実現
要約

スプレッドシートは、World Wide Web上で普遍的に使用されており、さまざまな分野での作業効率向上に重要な役割を果たしています。最近、大規模言語モデル(LLM)が自動的なスプレッドシート操作のために試みられていますが、推論の課題がある複雑で現実的なタスク(例:長期的な多段階推論や曖昧な要件を伴う操作)ではまだ十分に調査されていません。現実世界の要件とのギャップを埋めるために、私たちはSheetRMというベンチマークを導入します。このベンチマークは、現実的な課題によって引き起こされる推論依存型の長期的かつ多種類のタスクを特徴としています。これらの課題を軽減するために、さらにSheetAgentという新しい自律エージェントを提案します。SheetAgentは、プランナー、インフォーマー、リトリーバーという3つの協調モジュールから構成され、反復的なタスク推論と反省を通じて人間の介入なしで高度な推論と正確な操作を実現します。広範な実験により、SheetAgentは基準モデルに対して複数のベンチマークで20~40%の合格率向上を達成し、スプレッドシート操作の精度向上と優れたテーブル推論能力を示しています。詳細情報と可視化についてはプロジェクトウェブサイト(https://sheetagent.github.io/)をご覧ください。データセットとソースコードは https://anonymous.4open.science/r/SheetAgent から入手可能です。

SheetAgent: スプレッドシートの推論と操作を目的とした汎用エージェントの大規模言語モデルによる実現 | 最新論文 | HyperAI超神経