ComoRAG:状態保持型長文推論のための認知にインスパイアされた記憶組織型RAG

長編の物語や小説における物語理解は、複雑な展開や登場人物・実体間の錯綜した、しばしば変化する関係性に起因して、長らく困難な領域とされてきた。大規模言語モデル(LLM)が長文脈に対する推論能力が低下する一方で、計算コストも高いため、実用的な場面では検索ベースのアプローチが依然として中心的な役割を果たしている。しかし、従来のRAG(Retrieval-Augmented Generation)手法は、状態を持たず、単一ステップでの検索に依存するため、長距離文脈内における相互関連の動的な性質を捉えることができず、限界に達することがある。本研究では、物語理解における推論は一回限りの処理ではなく、新しい証拠の獲得と過去の知識の統合との間で動的に進化する相互作用であるという認識に基づき、ComoRAGを提案する。これは、脳内の記憶関連信号を用いた人間の認知プロセスに類似している。具体的には、推論の壁に直面した際、ComoRAGは動的なメモリワークスペースと連携しながら、反復的な推論サイクルを経る。各サイクルにおいて、新たな探索経路を設計するための探査クエリを生成し、新たな側面に関する検索結果を統合してグローバルメモリプールに蓄積することで、クエリ解決に向けた一貫性のある文脈の構築を支援する。4つの困難な長文脈物語理解ベンチマーク(20万トークン以上)において、ComoRAGは強力なRAGベースラインを上回り、最も優れたベースラインに対して最大11%の相対的な性能向上を達成した。さらに分析から、グローバルな理解を要する複雑なクエリに対して特に効果的であることが明らかになった。本研究は、状態を保持する推論に向けた、原理的かつ認知的に裏付けられた検索ベースの長文脈理解のパラダイムを提供する。コードは公開されており、https://github.com/EternityJune25/ComoRAG にて入手可能である。