Hook-basierte Agentic Memory über Frameworks hinweg
Der technologische Fokus verschiebt sich von der Entwicklung neuer Modelle hin zur Schaffung robuster Software-Umgebungen, die diese Modelle nutzbar machen. In diesem Kontext stellen Harnesses die notwendige Infrastruktur dar, die aus einem reinen Sprachtmodell ein funktionierendes Produkt verwandelt. Dazu gehören Agentenschleifen, Werkzeugdefinitionen, Kontextmanagement und vor allem Gedächtnissysteme. Die aktuelle Debatte im Bereich der KI-Code-Tools dreht sich darum, ob die Bindung an einen spezifischen Anbieter zu Abhängigkeiten führt. Wenn das Gedächtnis eines Agents in einem geschlossenen System oder hinter einer proprietären Schnittstelle liegt, gehört es nicht dem Nutzer, und der Wechsel des Tools wird durch hohe Kosten erschwert. Die vorgestellte Lösung besteht darin, die Gedächtnisschicht vollständig unabhängig vom jeweiligen Harness zu gestalten. Durch die Nutzung von Hooks, also automatisierten Programmier-Schnittstellen, die bei Lebenszyklus-Ereignissen auslösen, lässt sich eine einheitliche Speicherstruktur aufbauen, die zwischen verschiedenen Agenten wie Claude Code, OpenAI Codex und Cursor funktioniert. Als persistentes Speichermedium dient dabei die Neo4j-Datenbank. Model Context Protocol (MCP) Werkzeuge sind zwar nützlich, erfordern jedoch, dass das Modell aktiv entscheidet, wann und warum auf externe Systeme zugegriffen wird. Für eine zuverlässige Gedächtnisfunktion ist jedoch ein passiver, deterministischer Verlauf wünschenswert, der jede Sitzungssaktion ohne Verbrauch von Modell-Aufmerksamkeit erfasst. Genau dies bieten Hooks. Sie sind Shell-Kommandos, die standardisiert auf Events wie den Start einer Sitzung, das Einreichen eines Prompts, den Einsatz von Werkzeugen oder das Beenden der Sitzung reagieren. Jeder Anbieter nutzt im Wesentlichen denselben Vertrag: Ein JSON-Payload wird über den Standard-Eingabestrom empfangen und kann optional über den Standard-Ausgabestrom zurückgegeben werden, um Kontext in die Konversation einzuspeisen. Die Architektur des gemeinsamen Gedächtnisses speichert jede Sitzung als zusammenhängende Abfolge von Ereignissen in der Datenbank. Zwei dieser Events dienen als Einspeisepunkte für den Kontext: Zum Start der Sitzung werden gesammelte Profilinformationen dem System-Prompt vorangestellt, und bei der Eingabe eines neuen Prompts werden relevante Informationen daran angehängt. Dies ermöglicht eine nahtlose Übergreifung zwischen verschiedenen Harnesses. Zusätzlich zu diesem Online-Logging existiert eine sogenannte Traumphase als Offline-Batch-Job. Dieser Prozess analysiert gesammelte Ereignisdaten, fasst sie mithilfe einer KI zusammen und schreibt die Ergebnisse in eine strukturierte Wissensbasis aus Markdown-Dateien. Diese Datei-Struktur, ähnlich den Skills, die bereits von Anbietern wie Anthropic genutzt werden, erlaubt es, Wissen als lebendige Dokumente zu pflegen, die bei neuen Ereignissen aktualisiert statt einfach nur erweitert werden. Der Zugriff auf diese Gedächtnisschicht erfolgt über zwei Mechanismen. Hooks sorgen dafür, dass beim Start einer neuen Sitzung relevante Hintergrundinformationen automatisch in den Kontext geladen werden. Ergänzend könnten MCP-Werkzeuge eingesetzt werden, um dem Agenten direkten Zugriff auf das Datenbanksystem zu gewähren, was Such-, Schreib- und Löschoperationen ermöglicht. In der vorgestellten Umsetzung dominieren die Hooks, um Latenz zu minimieren und Determinismus zu gewährleisten. Das Ergebnis ist eine Architektur, in der das Gedächtnis unterhalb der einzelnen Tools existiert und von ihnen unabhängig ist. Nutzer können jederzeit zwischen verschiedenen Agenten wechseln, ohne ihren Kontext oder ihr Wissen zu verlieren, da die Schnittstellenstandardisierung durch Hooks eine einheitliche Steuerung ermöglicht. Der vollständige Code für diese Implementierung ist öffentlich verfügbar und demonstriert, wie eine echte Unabhängigkeit von Plattformen erreicht werden kann.
