Mehr als zwei Drittel der Multi-Agenten-KI sind ungenutzt
Eine neue, detaillierte Untersuchung der IEEE beleuchtet die Entwicklung von klassischen Multi-Agenten-Systemen hin zu solchen, die auf Large Language Models (LLMs) basieren. Die Studie, die 16 Seiten umfassen, 142 Quellen zitiert und Themen von Schwarmintelligenz bis zur Device-Edge-Cloud-Verknüpfung abdeckt, liefert ein klares Fazit: Zwei Drittel der Effektivität in solchen Systemen liegen nicht im Modell selbst, sondern in der darüberliegenden Infrastruktur. Ein zentraler Befund der Forschungsarbeit, die von Forschern für Regelungstechnik ohne Bezug zur Debatte über Modelle versus Infrastruktur erstellt wurde, zeigt, dass die Mehrzahl der Optimierungsmechanismen die Umgebung des Modells betrifft. Während LLMs die kognitive Leistung erbringen, bestimmen Architekturen, Datenverwaltung und Kommunikationsprotokolle, ob diese Leistung nutzbar wird. Dieses Muster bestätigt sich, wenn man einzelne Agenten betrachtet, die Versagensmodi wie Kontext-Überlastung oder Fehlerreparaturen aufweisen. Die Lösung liegt dabei fast immer nicht in einer Anpassung des Modells, sondern in Verbesserungen der sogenannten „Harness", also der tragenden Infrastruktur. Für Entwickler, die Multi-Agenten-Systeme aufbauen, bedeutet dies, dass die Investition in die reine Modellleistung nur ein Drittel des Erfolgs ausmacht. Fine-Tuning und Prompt-Optimierung sind wichtig, aber sie stellen nur eine von drei Schichten dar. Die anderen zwei Schichten – die Wissensschicht und die Systemschicht – umfassen die Speicherarchitektur, das Kontextmanagement, die Einsatztopologie und die Routing-Logik. Diese Bereiche bieten die eigentliche Hebelwirkung für die Systemleistung. Besonders kritisch ist die Kommunikation zwischen den Agenten. Die Studie dokumentiert neue Protokolle wie MCP, A2A und ANP und weist darauf hin, dass die Inter-Agent-Kommunikation oft der Engpass ist, nicht die Rechtfähigkeit eines einzelnen Modells. Daher muss die Kommunikation als erstklassiges Ingenieurproblem behandelt werden, einschließlich Strategien zur Reduzierung der Kommunikationskosten. Zudem erfordert die Architektur die Unterstützung von Heterogenität, da verschiedene Modelle auf unterschiedlichen Skalen mit variierenden Latenzen eingesetzt werden. Intelligente Routing-Mechanismen, etwa das Escalation-Prinzip, bei dem Unsicherheiten auf Edge-Geräten automatische Hilferufe an Cloud-Ressourcen auslösen, sind Beispiele für notwendige Infrastruktur-Designs, keine Trainingsmethoden. Zukünftig müssen Systeme so konzipiert sein, dass sie die Koexistenz von LLM-basierten Planern und klassischen Steuerungseinheiten ermöglichen. Die Schnittstellengestaltung wird hierbei zur größten Herausforderung. Die Erkenntnis fasst sich zusammen: Man optimiert ein Element, muss aber zwei Elemente ingenieurtechnisch realisieren. Die Modellschicht gehört zur Wissenschaft, während die Wissens- und Systemschichten zur Ingenieurskunst zählen. In der Produktion gewinnt die Ingenieurskunst. Das Modell liefert die Intelligenz, die Infrastruktur liefert das System. Letztlich entfällt der Großteil der Leistungsfähigkeit von Multi-Agenten-Intelligenz auf die richtige Vernetzung und Steuerung durch die umgebende Architektur.
