HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 14 heures

ToolOrchestra : L'Intelligence par une Orchestration Efficace de Modèles et d'Outils

ToolOrchestra : L'Intelligence par une Orchestration Efficace de Modèles et d'Outils

Résumé

Les grands modèles linguistiques sont des généralistes puissants, mais la résolution de problèmes profonds et complexes, tels que ceux posés par l’Humanity’s Last Exam (HLE), reste à la fois conceptuellement difficile et coûteuse en termes de calcul. Nous montrons qu’un petit orchestrateur capable de gérer d’autres modèles et une variété d’outils peut non seulement repousser la borne supérieure de l’intelligence, mais aussi améliorer l’efficacité dans la résolution de tâches agiles complexes. Nous introduisons ToolOrchestra, une méthode d’entraînement de petits orchestrateurs capables de coordonner des outils intelligents. ToolOrchestra utilise explicitement l’apprentissage par renforcement avec des récompenses conscientes des résultats, de l’efficacité et des préférences des utilisateurs. Grâce à ToolOrchestra, nous avons développé Orchestrator, un modèle de 8 milliards de paramètres, qui atteint une précision supérieure à un coût moindre que les agents précédents utilisant des outils, tout en respectant les préférences des utilisateurs quant aux outils à mobiliser pour une requête donnée. Sur l’HLE, Orchestrator obtient un score de 37,1 %, surpassant GPT-5 (35,1 %) tout en étant 2,5 fois plus efficace. Sur tau2-Bench et FRAMES, Orchestrator dépasse largement GPT-5, tout en ne consommant qu’environ 30 % des coûts. Une analyse approfondie révèle qu’Orchestrator réalise le meilleur compromis entre performance et coût selon plusieurs métriques, et se généralise de manière robuste à des outils inédits. Ces résultats démontrent que la composition de divers outils via un modèle d’orchestration léger est à la fois plus efficace et plus performante que les méthodes existantes, ouvrant la voie à des systèmes de raisonnement augmentés par des outils pratiques et évolutifs.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
ToolOrchestra : L'Intelligence par une Orchestration Efficace de Modèles et d'Outils | Articles de recherche | HyperAI