vor 13 Tagen

Nexus: Ein leichtgewichtiges und skalierbares Multi-Agenten-Framework zur Automatisierung komplexer Aufgaben

Humza Sami, Mubashir ul Islam, Samy Charas, Asav Gandhi, Pierre-Emmanuel Gaillardon, Valerio Tenace

Abstract

Neuere Fortschritte in Large Language Models (LLMs) haben die Fähigkeiten von Multi-Agent-Systemen (MASs) erheblich weiterentwickelt und Systeme ermöglicht, die nicht nur Aufgaben automatisieren, sondern zudem nahezu menschenähnliche Schlussfolgerungsfähigkeiten nutzen. Um dies zu erreichen, müssen LLM-basierte MASs auf zwei zentrale Prinzipien aufbauen: (i) einer robusten Architektur, die das volle Potenzial der LLMs für spezifische Aufgaben – oder Aufgabensets – ausschöpft, sowie (ii) einer effektiven Methode, um LLMs mit den notwendigen Fähigkeiten auszustatten, um Aufgaben effizient auszuführen und Informationen optimal zu verwalten. Selbstverständlich können vorgängige architektonische Entwürfe die Skalierbarkeit und die Anpassungsfähigkeit an verschiedene Domänen eines gegebenen MAS einschränken.Um diesen Herausforderungen zu begegnen, stellen wir in diesem Artikel Nexus vor: ein leichtgewichtiges Python-Framework, das die einfache Erstellung und Verwaltung von LLM-basierten MASs ermöglicht. Nexus bringt folgende Innovationen mit sich: (i) eine flexible Mehr-Ebenen-Überwachungs-Hierarchie, (ii) ein vereinfachtes Arbeitsablauf-Design sowie (iii) eine einfache Installation und offene Flexibilität: Nexus kann über pip installiert werden und wird unter einer proklamierenden Open-Source-Lizenz bereitgestellt, sodass Nutzer die Funktionalität frei modifizieren und erweitern können.Experimentelle Ergebnisse zeigen, dass mit Nexus aufgebaute Architekturen eine state-of-the-art-Leistung in vielfältigen Domänen erzielen. Bei Programmieraufgaben erreichen Nexus-getriebene MASs eine Bestehensrate von 99 % auf HumanEval und eine fehlerfreie 100 % auf VerilogEval-Human, wodurch sie bahnbrechende Schlussfolgerungs-LLMs wie o3-mini und DeepSeek-R1 übertreffen. Darüber hinaus zeigen diese Architekturen eine robuste Kompetenz bei komplexen Schlussfolgerungen und mathematischen Problemlösungen und liefern korrekte Lösungen für alle zufällig aus dem MATH-Datensatz ausgewählten Aufgaben. Im Bereich der mehrzielbasierten Optimierung gelingt es Nexus-basierten Architekturen, anspruchsvolle Timing-Closure-Aufgaben auf Designs aus der VTR-Benchmark-Suite erfolgreich zu lösen und dabei im Durchschnitt eine Stromersparnis von nahezu 30 % zu gewährleisten.