HyperAIHyperAI
il y a 17 jours

Agents efficaces : Construire des agents performants tout en réduisant les coûts

Ningning Wang, Xavier Hu, Pai Liu, He Zhu, Yue Hou, Heyuan Huang, Shengyu Zhang, Jian Yang, Jiaheng Liu, Ge Zhang, Changwang Zhang, Jun Wang, Yuchen Eleanor Jiang, Wangchunshu Zhou
Agents efficaces : Construire des agents performants tout en réduisant les coûts
Résumé

Les capacités remarquables des agents pilotés par les grands modèles linguistiques (LLM) ont permis le développement de systèmes sophistiqués capables de traiter des tâches complexes et à plusieurs étapes, mais leurs coûts croissants menacent leur évolutivité et leur accessibilité. Ce travail présente la première étude systématique du compromis entre efficacité et performance dans les systèmes d'agents modernes, répondant ainsi à un besoin critique en matière de conceptions économiquement viables sans sacrifice de performance. Nous abordons trois questions clés : (1) Quel degré de complexité les tâches d'agents exigent-elles intrinsèquement ? (2) À quel moment l'ajout de modules supplémentaires conduit-il à des rendements décroissants ? (3) Quel gain d'efficacité peut être obtenu grâce à la conception de cadres d'agents efficaces ? À partir d'une analyse empirique sur le benchmark GAIA, nous évaluons l'impact du choix du modèle LLM de base, des architectures de cadre d'agent et des stratégies d'échelonnement au moment du test. En utilisant la métrique cost-of-pass, nous quantifions le compromis entre efficacité et performance sur ces différents axes. Nos résultats permettent de concevoir Efficient Agents, un nouveau cadre d'agent dont la complexité est optimisée par rapport aux exigences de la tâche. Efficient Agents préserve 96,7 % de la performance d'OWL, l'un des cadres d'agents open-source les plus performants, tout en réduisant les coûts opérationnels de 0,398 $ à 0,228 $, soit une amélioration de 28,4 % de la métrique cost-of-pass. Ce travail fournit des orientations concrètes pour concevoir des systèmes d'agents à la fois efficaces et performants, contribuant ainsi à améliorer l’accessibilité et la durabilité des solutions pilotées par l’intelligence artificielle.