Agent KB: Die Nutzung von Erfahrungen aus verschiedenen Domänen für agentenbasiertes Problemlösen

Während Sprachagenten zunehmend komplexere Aufgaben bewältigen, ringen sie mit effektiver Fehlerkorrektur und der Wiederverwendung von Erfahrungen über verschiedene Domänen hinweg. Wir stellen Agent KB vor, ein hierarchisches Erfahrungsframework, das durch einen neuartigen Reason-Retrieve-Refine-Prozess (Schließen-Abrufen-Verfeinern) die Lösung komplexer agenterhafter Probleme ermöglicht. Agent KB behebt eine zentrale Einschränkung: Traditionally konnten Agenten nicht aus den Erfahrungen anderer lernen. Durch die Erfassung sowohl hochabstrakter Strategien als auch detaillierter Ausführungsprotokolle schafft Agent KB eine gemeinsame Wissensbasis, die den Wissenstransfer zwischen Agenten ermöglicht. Bei der Bewertung am GAIA-Benchmark verbessert Agent KB die Erfolgsraten um bis zu 16,28 Prozentpunkte. Bei den anspruchsvollsten Aufgaben steigert Claude-3 seine Leistung von 38,46 % auf 57,69 %, während GPT-4 bei mittelschweren Aufgaben von 53,49 % auf 73,26 % aufsteigt. Bei der Code-Reparatur im SWE-bench erhöht Agent KB die Leistung von Claude-3 von 41,33 % auf 53,33 %. Unsere Ergebnisse deuten darauf hin, dass Agent KB eine modulare und framework-unabhängige Infrastruktur bereitstellt, die es Agenten ermöglicht, aus vergangenen Erfahrungen zu lernen und erfolgreiche Strategien auf neue Aufgaben zu verallgemeinern.