LlamaIndex introduit la persistance dans les workflows agents pour une résilience proactive
LlamaIndex introduit une approche innovante pour rendre les workflows agents durables grâce à une persistance contrôlée, en réponse à l’évolution du paysage des systèmes d’intelligence artificielle. Si le terme « agent IA » perd de sa popularité, le concept de workflow agent gagne en importance : il s’agit de processus structurés où une certaine autonomie est exercée dans des cadres définis. Cependant, LlamaIndex souligne que les workflows sont fondamentalement éphémères — leur état n’est pas conservé automatiquement, ce qui limite leur capacité à se rétablir après une panne. Pour éviter un surcoût inutile lié à la sauvegarde continue, l’outil ne prend pas de captures automatiques de l’état. À la place, il encourage les développeurs à intégrer manuellement la persistance à des points critiques du processus, par exemple en utilisant une base de données externe comme Redis ou SQLite. Un exemple concret montre comment persister l’état d’un workflow long, par exemple lors du traitement de centaines de documents. Il suffit de stocker l’identifiant du dernier document traité dans un magasin d’état. Cette approche évoque des recherches récentes d’OpenAI sur l’utilisation des morceaux de RAG comme des mémoires micro-temporelles, où chaque fragment de données est associé à un contexte temporel et évolutif. Dans un exemple pratique, un workflow simple de comptage est implémenté avec LlamaIndex. À chaque exécution, il incrémente un compteur. En utilisant Context et edit_state, l’état est modifié de manière asynchrone. Pour assurer la persistance, une connexion à une base SQLite est injectée via un Resource. À chaque étape, l’état du contexte est sérialisé en JSON et enregistré dans une table state. Après une première exécution (affichant « The step ran 1 times »), le workflow peut être relancé avec un contexte restauré à partir de la base de données, ce qui permet de continuer le comptage à partir du point d’arrêt (« The step ran 2 times »). Cette architecture offre une grande flexibilité : elle permet de répartir des workflows sur plusieurs machines, de les interrompre et de les reprendre sans perte de données, tout en évitant la surcharge liée à une persistance automatique. Elle s’inscrit dans une tendance plus large vers des systèmes modulaires, résilients et évolutifs, où les workflows ne sont plus des chaînes linéaires mais des processus dynamiques capables de mémoriser leur progression. Des experts du secteur soulignent que cette approche représente une avancée significative dans la conception d’applications agentes évolutives. Elle combine la souplesse des workflows avec les garanties de persistance nécessaires pour les déploiements en production. Des entreprises comme Kore.ai, actives dans les chatbots et les assistants conversationnels, valorisent ce type d’architecture pour construire des systèmes intelligents, résilients et capables de mémoriser des interactions complexes sur le long terme.