ComoRAG : Un modèle RAG inspiré par le cognition et organisé par la mémoire pour le raisonnement narratif long et étatique

La compréhension narrative des longs récits et des romans constitue un domaine particulièrement difficile, en raison de la complexité de leurs intrigues ainsi que des relations multiples, souvent évoluées, entre les personnages et les entités. Étant donné que les grands modèles linguistiques (LLM) voient leur capacité de raisonnement diminuer avec l’extension du contexte, et que leur coût computationnel reste élevé, les approches basées sur la récupération (RAG) restent fondamentales en pratique. Toutefois, les méthodes RAG traditionnelles peinent à répondre aux exigences du domaine, en raison de leur processus de récupération sans état et à un seul pas, qui néglige fréquemment la nature dynamique de la capture des relations interconnectées dans un contexte à longue portée. Dans ce travail, nous proposons ComoRAG, un cadre fondé sur l'idée que le raisonnement narratif n’est pas un processus ponctuel, mais un échange dynamique et évolutif entre l’acquisition de nouvelles preuves et la consolidation des connaissances passées, analogue à la cognition humaine lorsqu’elle traite des signaux liés à la mémoire dans le cerveau. Plus précisément, en cas d’impasse dans le raisonnement, ComoRAG entreprend des cycles itératifs de raisonnement tout en interagissant avec un espace de mémoire dynamique. À chaque cycle, il génère des requêtes d’exploration pour concevoir de nouveaux chemins d’investigation, puis intègre les nouvelles preuves récupérées dans un pool de mémoire global, permettant ainsi l’émergence d’un contexte cohérent propice à la résolution de la requête. Sur quatre défis difficiles reposant sur des contextes longs (plus de 200 000 tokens), ComoRAG surpasser les meilleures méthodes RAG existantes, avec des gains relatifs constants atteignant jusqu’à 11 % par rapport au meilleur modèle de référence. Une analyse approfondie révèle que ComoRAG se distingue particulièrement pour les requêtes complexes nécessitant une compréhension globale, offrant ainsi un cadre rigoureux et motivé par la cognition pour la compréhension contextuelle à longue portée basée sur la récupération, vers un raisonnement à état. Le code source de notre travail est disponible publiquement à l’adresse suivante : https://github.com/EternityJune25/ComoRAG