Command Palette
Search for a command to run...
Duolin Sun Dan Yang Yue Shen Yihan Jiao Zhehao Tan Jie Feng Lianzhen Zhong Jian Wang Peng Wei Jinjie Gu

要約
リトリーブ増強生成(Retrieval-Augmented Generation, RAG)アプローチは、大規模言語モデル(Large Language Models, LLMs)と情報検索(Information Retrieval, IR)技術を統合することで、質問応答システムおよび対話生成タスクの性能を向上させます。この戦略は、外部の知識ベースから情報を取得し、生成モデルの応答能力を強化するものであり、一定の成功を収めてきました。しかし、現在のRAG手法は、マルチホップクエリ(多段階クエリ)に対処する際、依然として多数の課題に直面しています。例えば、一部の手法は反復的なリトリーブに過度に依存しており、複合的なクエリに対して不必要な多くのリトリーブステップを消費しています。また、元の複雑なクエリをそのままリトリーブに用いる場合、特定の部分クエリに関連する内容を正確に捉えられず、ノイズを含んだ検索結果が得られてしまうことがあります。このようなノイズが適切に管理されない場合、ノイズの蓄積問題につながるおそれがあります。こうした課題に対処するため、本研究では、多様な複雑さを持つ問題に効率的に対応できる新しいヒューリスティックベースのフレームワーク「HANRAG」を提案します。強力な「リベレイター(revealer)」を駆動源として、HANRAGはクエリをルーティングし、部分クエリに分解し、検索された文書からノイズをフィルタリングします。これにより、システムの適応性とノイズ耐性が向上し、多様なクエリ処理に優れた能力を発揮します。提案手法を、さまざまなベンチマーク上で他の先進的な業界手法と比較した結果、単一ホップおよびマルチホップの質問応答タスクにおいて、いずれも優れた性能を達成することが示されました。