HyperAIHyperAI
il y a 13 jours

Nexus : un cadre léger et évolutif à multiples Agents pour l'automatisation de tâches complexes

Humza Sami, Mubashir ul Islam, Samy Charas, Asav Gandhi, Pierre-Emmanuel Gaillardon, Valerio Tenace
Nexus : un cadre léger et évolutif à multiples Agents pour l'automatisation de tâches complexes
Résumé

Les avancées récentes dans les grands modèles linguistiques (LLM) ont considérablement amélioré les capacités des systèmes multi-agents (MAS), permettant la conception de systèmes capables non seulement d’automatiser des tâches, mais aussi de tirer parti de capacités de raisonnement proches de celles de l’humain. Pour atteindre cet objectif, les MAS basés sur les LLM doivent s’appuyer sur deux principes fondamentaux : (i) une architecture solide exploitant pleinement le potentiel des LLM pour des tâches spécifiques ou des ensembles de tâches connexes, et (ii) une méthodologie efficace permettant d’équiper les LLM des capacités nécessaires pour exécuter des tâches et gérer efficacement l’information. Il va sans dire que des conceptions architecturales préétablies peuvent limiter la scalabilité et l’adaptabilité aux domaines d’un MAS donné.Afin de relever ces défis, nous introduisons dans cet article Nexus : un cadre léger en Python conçu pour faciliter la construction et la gestion des MAS basés sur les LLM. Nexus apporte les innovations suivantes : (i) une hiérarchie flexible à plusieurs superviseurs, (ii) une conception simplifiée du flux de travail, et (iii) une installation facile et une flexibilité open-source : Nexus peut être installé via pip et est distribué sous une licence open-source permissive, permettant aux utilisateurs de modifier librement et d’étendre ses fonctionnalités.Les résultats expérimentaux démontrent que les architectures construites avec Nexus atteignent des performances de pointe dans divers domaines. Dans les tâches de codage, les MAS pilotés par Nexus obtiennent un taux de réussite de 99 % sur HumanEval et un résultat parfait de 100 % sur VerilogEval-Human, surpassant des modèles de raisonnement de pointe tels qu’o3-mini et DeepSeek-R1. En outre, ces architectures font preuve d’une maîtrise solide du raisonnement complexe et de la résolution de problèmes mathématiques, fournissant des solutions correctes pour l’ensemble des problèmes aléatoirement sélectionnés du jeu de données MATH. Dans le domaine de l’optimisation multi-objectifs, les architectures basées sur Nexus parviennent à résoudre efficacement des tâches exigeantes de fermeture temporelle sur des conceptions issues du benchmark VTR, tout en garantissant, en moyenne, une réduction de consommation d’énergie d’environ 30 %.

Nexus : un cadre léger et évolutif à multiples Agents pour l'automatisation de tâches complexes | Articles de recherche récents | HyperAI