HyperAIHyperAI

Command Palette

Search for a command to run...

MIT et Microsoft optimisent les agents IA avec Murakkab

Des chercheurs du MIT et de Microsoft Azure ont conçu Murakkab, un système d'optimisation visant à réduire la consommation d'énergie, les coûts et les délais des workflows d'agents autonomes. Ces architectures logicielles combinent plusieurs modèles d'intelligence artificielle et outils externes pour exécuter des tâches complexes comme l'analyse vidéo ou la génération de code. Leur conception traditionnelle exige une configuration technique manuelle et aboutit fréquemment à un surdimensionnement des ressources cloud, générant gaspillage énergétique et dépenses inutiles. Murakkab automatise et simplifie ce processus. Les développeurs décrivent leurs objectifs en langage courant sans préciser l'architecture technique. Le système identifie alors automatiquement les modèles et outils les plus adaptés, détermine les enchaînements séquentiels ou parallèles, et configure l'allocation des ressources matérielles en temps réel. Il s'ajuste dynamiquement selon les priorités définies par l'utilisateur, qu'il s'agisse de prioriser la vitesse, la précision ou la réduction budgétaire. Sa capacité à intégrer automatiquement les nouvelles versions de modèles ou accélérateurs matériels élimine les mises à jour manuelles fastidieuses. Les tests sur des charges de travail réelles confirment l'efficacité de l'approche. Par rapport aux méthodes conventionnelles, la plateforme a réduit de 65 % le nombre d'unités de calcul nécessaires, diminué la consommation énergétique de 73 % et limité les coûts à moins de 25 %. Cette optimisation ne compromet pas les performances : dans certains scénarios, la réduction de l'énergie a dépassé un ordre de grandeur pour une perte de précision inférieure à 2 %. Grâce à sa visibilité centralisée, le système permet également aux fournisseurs cloud d'équilibrer plus efficacement la charge entre plusieurs utilisateurs simultanés. Cette solution répond à un enjeu structurel de l'industrie. L'adoption croissante des workflows agents au sein des data centers accentue la pression sur la consommation électrique et les budgets informatiques. Gohar Chaudhry, auteur principal du projet au MIT, insiste sur la nécessité d'optimiser ces architectures avant qu'elles ne deviennent ingérables à grande échelle. L'équipe, accompagnée par Adam Belay du MIT et Ricardo Bianchini de Microsoft Azure, publiera ses résultats lors du symposium USENIX sur les systèmes d'exploitation. Les prochaines étapes consistent à étendre le moteur à des architectures plus complexes et à le déployer sur des clusters cloud de plus grande taille, afin de standardiser une exécution des applications IA plus sobre et performante à l'échelle mondiale.

Liens associés