ComoRAG: Ein kognitionsinspiriertes, speicherorganisiertes RAG für zustandsbehaftete lange narrative Schlussfolgerungen

Die Verständnisfähigkeit von langen Geschichten und Romanen stellt aufgrund ihrer komplexen Handlungsstränge und der oft sich wandelnden, miteinander verflochtenen Beziehungen zwischen Figuren und Entitäten eine herausfordernde Aufgabe dar. Angesichts der eingeschränkten Schlussfolgerungskapazität von großen Sprachmodellen (LLMs) bei langen Kontexten sowie der hohen Rechenkosten bleibt der ansatzbasierte Retrieval-Ansatz in der Praxis weiterhin von entscheidender Bedeutung. Traditionelle RAG-Methoden stoßen jedoch auf Schwächen, da sie einen zustandslosen, einstufigen Retrieval-Prozess verwenden, der die dynamische Natur der Erfassung verknüpfter Beziehungen innerhalb langer Kontexte häufig übersehen kann. In dieser Arbeit stellen wir ComoRAG vor, dessen Grundprinzip besagt, dass narrative Schlussfolgerung kein einstufiger Prozess ist, sondern ein dynamischer, sich kontinuierlich entwickelnder Austausch zwischen der Gewinnung neuer Hinweise und der Konsolidierung vorheriger Kenntnisse – analog zur menschlichen kognitiven Verarbeitung, bei der Gedächtnis-signalbasierte Informationen im Gehirn verarbeitet werden. Konkret durchläuft ComoRAG bei einem Schlussfolgerungsblockade iterativ wiederholte Schlussfolgerungscycles, während es mit einem dynamischen Gedächtnis-Arbeitsraum interagiert. In jedem Zyklus generiert es gezielte Untersuchungsfragen, um neue Erkundungspfade zu erschließen, und integriert anschließend die abgerufenen Hinweise zu neuen Aspekten in einen globalen Gedächtnis-Pool. Dadurch wird eine kohärente Kontextbasis für die Lösung der ursprünglichen Frage ermöglicht. Auf vier anspruchsvollen Benchmarks für lange Kontexte (jeweils über 200.000 Tokens) übertrifft ComoRAG starke RAG-Baselines mit konsistenten relativen Verbesserungen von bis zu 11 % gegenüber der stärksten Baseline. Weitere Analysen zeigen, dass ComoRAG besonders vorteilhaft für komplexe Fragen ist, die eine globale Verständnisfähigkeit erfordern, und bietet damit ein konsistentes, kognitionsbasiertes Paradigma für den retrievalbasierten Umgang mit langen Kontexten im Sinne zustandsbasiertem Schließen. Der Quellcode ist öffentlich unter https://github.com/EternityJune25/ComoRAG verfügbar.