HyperAI
vor 16 Tagen

MIRIX: Mehragentenspeichersystem für LLM-basierte Agenten

Yu Wang, Xi Chen
MIRIX: Mehragentenspeichersystem für LLM-basierte Agenten
Abstract

Obwohl die Gedächtnisfähigkeiten von KI-Agenten zunehmend Beachtung finden, bleiben bestehende Lösungen grundsätzlich begrenzt. Die meisten basieren auf flachen, eng umrissenen Gedächtniskomponenten, die ihre Fähigkeit einschränken, personalisiert zu agieren, abstrakt zu denken und benutzerspezifische Informationen über längere Zeiträume hinweg verlässlich abzurufen. In diesem Kontext stellen wir MIRIX vor, ein modulares, mehragentiges Gedächtnissystem, das die Zukunft des KI-Gedächtnisses neu definiert, indem es die wichtigste Herausforderung des Bereichs löst: Sprachmodellen das wahre Erinnern zu ermöglichen. Im Gegensatz zu früheren Ansätzen geht MIRIX über Text hinaus und nimmt reiche visuelle und multimodale Erfahrungen auf, was das Gedächtnis in realen Anwendungsszenarien wirklich nützlich macht. MIRIX besteht aus sechs unterschiedlichen, sorgfältig strukturierten Gedächtnistypen: Kerngedächtnis (Core), Episodisches Gedächtnis (Episodic), Semantisches Gedächtnis (Semantic), Prozedurales Gedächtnis (Procedural), Ressourcengedächtnis (Resource Memory) und Wissensdepot (Knowledge Vault). Diese werden durch einen mehragentigen Rahmen ergänzt, der dynamisch Aktualisierungen und Abrufe steuert und koordiniert. Dieses Design ermöglicht es den Agenten, vielfältige, langfristige Benutzerdaten in großem Umfang dauerhaft zu speichern, darüber zu reflektieren und sie präzise abzurufen. Wir validieren MIRIX in zwei anspruchsvollen Szenarien. Erstens auf ScreenshotVQA, einem herausfordernden multimodalen Benchmark mit fast 20.000 hochaufgelösten Computerscreenshots pro Sequenz, der eine tiefe kontextuelle Verständnis erfordert und bei dem keine existierenden Gedächtnissysteme anwendbar sind. Hier erreicht MIRIX eine Genauigkeit von 35 % höher als die RAG-Basislinie und reduziert gleichzeitig die Speicheranforderungen um 99,9 %. Zweitens auf LOCOMO, einem Benchmark für lange formelle Konversationen mit einmodalem textbasiertem Eingangssignal. Hier erzielt MIRIX eine Spitzenleistung von 85,4 % und übertreffen damit deutlich bestehende Baseline-Modelle. Diese Ergebnisse zeigen, dass MIRIX eine neue Leistungsstandards für langlebiges LLM-Gedächtnis setzt. Um den Nutzern die Möglichkeit zu geben, unser Gedächtnissystem selbst zu erleben, stellen wir eine verpackte Anwendung zur Verfügung, die von MIRIX angetrieben wird. Sie überwacht den Bildschirm in Echtzeit, baut eine personalisierte Gedächtnisbasis auf und bietet intuitive Visualisierung sowie sichere lokale Speicherung zur Gewährleistung der Privatsphäre.