Un nouveau concept pour les systèmes RAG : des morceaux de données comme des micro-archives temporelles
Les graphes de connaissance traditionnels, utilisés dans les systèmes de génération augmentée par la recherche (RAG), stockent les faits sous forme d'entités statiques, c'est-à-dire de fragments de données fixes. Cependant, dans la réalité, les informations évoluent constamment, rendant parfois les données antérieures obsolètes. Par exemple, les chiffres de chiffre d'affaires d'une entreprise d'un trimestre précédent peuvent être remplacés par des données plus récentes, ce qui pourrait entraîner des erreurs si le système ne tient pas compte des changements temporels. Plutôt que de recréer entièrement les fragments à chaque mise à jour, une solution consiste à créer des versions de chaque fragment pour qu'ils agissent comme des micro-archives de mémoire. Les graphes de connaissance temporels (TKG) intègrent une dimension temporelle, comme des dates de validité, dans la structure des fragments. Cela permet aux faits d'être associés à des périodes spécifiques, facilitant des requêtes comme "Qui était le PDG à une date donnée ?" ou l'analyse de l'évolution des relations et des entités dans le temps. Ces TKG utilisent des triplets temporellement étiquetés (sujet-prédicat-objet avec des plages de validité) pour capturer des connaissances en mutation provenant de sources comme des documents ou du texte non structuré. L'un des piliers fondamentaux des agents d'intelligence artificielle est la mémoire, qui permet aux agents de conserver le contexte des interactions précédentes, assurant ainsi une continuité et améliorant l'expérience utilisateur. Bien que le RAG se concentre sur la fourniture de contexte à jour pendant l'inférence, il n'est pas conçu comme un système de mémoire. Il injecte des fragments de données optimaux dans les prompts, évitant d'être trop courts ou trop longs. Les agents d'intelligence artificielle temporelle combinent les éléments de mémoire et du RAG, améliorant ainsi la réponse en ajoutant un historique contextuel. Dans ce modèle, les fragments sont traités comme des micro-archives de mémoire. Chaque fragment est transformé en triplets temporels, avec des métadonnées comme "valid_at" (date de validité) et "expired_at" (date d'expiration). Ces triplets sont stockés dans un graphe de connaissance et agissent comme des unités de mémoire compactes et contextuelles, préservant à la fois le contenu et sa pertinence temporelle. Cette approche permet au système de surveiller les contextes en évolution pour les requêtes RAG ou d'autres applications. Contrairement aux systèmes de mémoire complets qui incluent des éléments épisodiques ou procéduraux, ces micro-archives se concentrent sur les faits temporellement conscients, offrant une base légère et préservant l'historique pour gérer des données dynamiques. Cela est particulièrement utile dans des scénarios comme l'analyse financière ou le suivi des préférences clients. Un exemple de code montre comment extraire ces triplets à partir de fragments de texte, les ajouter au graphe de connaissance avec des métadonnées temporelles, et gérer les conflits en marquant les anciens triplets comme obsolètes. Ce processus permet de maintenir une version actualisée des données sans avoir à recréer l'ensemble du graphe. Cette approche de gestion temporelle des fragments offre une meilleure précision et pertinence des informations, ce qui est crucial pour les systèmes d'IA en environnements en constante évolution. Les experts du secteur soulignent que cette méthode améliore la fiabilité et la réactivité des agents d'IA, en particulier dans les domaines exigeant une prise de décision basée sur des données actualisées. Des entreprises comme Kore.ai, qui travaillent sur l'intersection de l'IA et du langage, mettent en avant l'importance de ces micro-archives pour des applications agentes performantes.