KI-System beschleunigt KI-Agenten und senkt Energiebedarf
Forscher der Massachusetts Institute of Technology (MIT) und von Microsoft Azure haben ein neues System namens Murakkab vorgestellt, das die Effizienz und Energiebilanz von agentic Workflows für KI-Anwendungen erheblich verbessert. Die Studie, die auf dem USENIX Symposium on Operating Systems Design and Implementation präsentiert wird, adressiert ein zentrales Problem der modernen KI-Entwicklung: Die manuelle Konfiguration komplexer, mehrstufiger Agentensysteme führt häufig zu ineffizienter Ressourcennutzung, hohem Energieverbrauch und steigenden Cloud-Kosten. Agentic Workflows verbinden mehrere autonome KI-Modelle und externe Tools, um komplexe Aufgaben wie Videanalyse, Datenverarbeitung oder Codegenerierung zu bewältigen. Bisher mussten Entwickler alle technischen Details vorab festlegen, darunter die Auswahl der Modelle, deren Reihenfolge und die Hardware-Allokation. Diese starre Architektur ist jedoch anfällig für Ineffizienzen, insbesondere da sich die Verfügbarkeit neuer Modelle und Beschleuniger kontinuierlich ändert und Cloud-Rechenzentren oft keinen optimalen Einblick in die internen Arbeitsabläufe haben. Murakkab automatisiert diesen gesamten Prozess. Entwickler beschreiben ihr Anliegen lediglich in natürlicher Sprache, woraufhin die Plattform dynamisch die geeignetsten Modelle, Tools und Ausführungsreihenfolgen identifiziert. Das System berechnet autonom, welche Komponenten sequenziell und welche parallel verarbeitet werden müssen. Bei der Bereitstellung in der Cloud passt Murakkab die Ressourcenverteilung in Echtzeit an die Nutzerprioritäten an, sei es minimale Kosten, maximale Geschwindigkeit oder hohe Genauigkeit. Cloud-Anbietern wird zudem eine übergreifende Transparenz ermöglicht, sodass Rechenkapazitäten workload-übergreifend effizient geteilt werden können. In Tests zur Videobefragungsanalyse und Codegenerierung zeigte Murakkab signifikante Leistungsvorteile. Im Vergleich zu herkömmlichen Methoden reduzierte das System den benötigten Rechenaufwand um etwa 65 Prozent, den Energieverbrauch um rund 73 Prozent und die Kosten auf weniger als ein Viertel. Selbst bei einer minimalen Genauigkeitsabnahme von zwei Prozent ließ sich der Energieverbrauch um mehr als den Zehnfachen des ursprünglichen Werts senken. Die automatische Optimierung identifizierte zudem unerwartet effiziente Konfigurationen, die manuell kaum erreichbar wären. Gohar Chaudhry, leitender Autor der Studie und EECS-Graduiertenstudent am MIT, betont die Notwendigkeit energieeffizienter Architekturen, da agentic Workflows zunehmend zur Grundlage cloudbasierter KI-Dienste werden. Zusammen mit Adam Belay vom MIT CSAIL sowie Ricardo Bianchini von Microsoft Azure zeigt die Forschung, wie dynamische Allokationsstrategien sowohl Entwicklern als auch Rechenzentrumsbetreibern wirtschaftliche und ökologische Vorteile bieten. Die Arbeiten wurden unter anderem von der Semiconductor Research Corporation und der DARPA unterstützt. Künftige Forschungsschritte sollen die Skalierung auf komplexere Workflows und größere Clustersysteme umfassen, um die Optimierung agentic KI-Anwendungen auf Cloud-Maßstab weiter zu etablieren.
