2日前
GTool:大規模言語モデルを用いたグラフ強化型ツール計画
Wenjie Chen, Wenbin Li, Di Yao, Xuying Meng, Chang Gong, Jingping Bi

要約
大規模言語モデル(LLM)を用いたツール計画とは、ユーザーの要求を達成するために必要なツールの選定、整理、準備を行うプロセスを指し、自然言語理解とタスク実行の間のギャップを埋める役割を果たす。しかし、従来の手法では異なるツールを独立したコンポーネントとして扱っており、ツール間の内在的な依存関係を活用できていないため、無効な計画結果が生じる場合がある。特にツールセットが大きくなると、ツールの依存関係が不完全であることが多く、LLMがユーザー要求に適した正しいツールを正確に特定することが困難となる。この課題を解決するために、本研究では不完全な依存関係下でもLLMのツール計画能力を向上させる初の手法であるGToolを提案する。GToolは、ユーザー要求に応じたツールグラフを構築し、効率的なツール選定と、LLMが理解可能な十分な依存関係情報を含む「」の生成を実現する。さらに、不完全な依存関係下での信頼性を高めるために、欠落した依存関係を予測するタスクを設計した。GToolはLLMの構造を変更せず、再学習をほとんど行わずにさまざまなLLMバックボーンとシームレスに統合可能である。広範な実験の結果、GToolは軽量(7Bパラメータ)のLLMバックボーンを用いて、最先端(SOTA)のベースラインと比較して29.6%以上の性能向上を達成した。