Agent KB : Exploiter l'expérience interdomaines pour la résolution de problèmes agentenelle

Alors que les agents linguistiques abordent des tâches de plus en plus complexes, ils rencontrent des difficultés pour corriger efficacement les erreurs et réutiliser l'expérience à travers différents domaines. Nous présentons Agent KB, un cadre d'expérience hiérarchique qui permet la résolution de problèmes agencés complexes grâce à un nouveau pipeline Raisonner-Récupérer-Raffiner (Reason-Retrieve-Refine). Agent KB répond à une limitation fondamentale : traditionnellement, les agents ne peuvent pas apprendre des expériences les uns des autres. En capturant à la fois des stratégies de haut niveau et des journaux d'exécution détaillés, Agent KB crée une base de connaissances partagée qui facilite le transfert de connaissances entre les agents. Évalué sur le banc d'essai GAIA, Agent KB améliore les taux de réussite jusqu'à 16,28 points de pourcentage. Pour les tâches les plus difficiles, Claude-3 passe de 38,46% à 57,69%, tandis que GPT-4 passe de 53,49% à 73,26% sur les tâches intermédiaires. Sur le banc d'essai SWE-bench pour la réparation de code, Agent KB permet à Claude-3 d'améliorer son taux de réussite de 41,33% à 53,33%. Nos résultats suggèrent qu'Agent KB fournit une infrastructure modulaire et indépendante du cadre pour permettre aux agents d'apprendre des expériences passées et de généraliser des stratégies réussies à de nouvelles tâches.