17日前

RAPTOR:ツリー構造化検索における再帰的抽象的処理

Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, Christopher D. Manning
RAPTOR:ツリー構造化検索における再帰的抽象的処理
要約

検索拡張型言語モデルは、世界状態の変化に適応し、長尾知識を統合する能力に優れています。しかし、現存する大多数の手法は、検索コーパスから短い連続するテキスト断片のみを取得するため、全体的な文書コンテキストに対する包括的な理解が制限されています。本研究では、テキスト断片を再帰的に埋め込み、クラスタリングし、要約することで、下位から上位へと異なる要約レベルを持つ木構造を構築する新規アプローチを提案します。推論時には、この木構造から情報を検索し、異なる抽象レベルで長大なドキュメント間の情報を統合します。制御実験の結果、従来の検索拡張型言語モデルと比較して、再帰的要約を用いた検索により、複数のタスクで顕著な性能向上が達成されました。特に、複雑で多段階の推論を要する質問応答タスクにおいて、最先端の成果を示しました。例えば、RAPTORの検索機構とGPT-4を組み合わせることで、QuALITYベンチマークにおける最良性能が絶対精度で20%向上しました。

RAPTOR:ツリー構造化検索における再帰的抽象的処理 | 最新論文 | HyperAI超神経