Command Palette
Search for a command to run...
AWorld : Orchestration de la recette d'entraînement pour l'intelligence artificielle agente

Résumé
Le paradigme d’apprentissage à partir de l’expérience est fondamental pour le développement de systèmes d’IA agente performants, mais il est sévèrement freiné par une génération inefficace des expériences, un goulot d’étranglement particulièrement marqué sur des benchmarks complexes comme GAIA. Pour y remédier, nous introduisons AWorld, un système open source conçu pour permettre des interactions à grande échelle entre agents et environnements. En répartissant les tâches sur un cluster, AWorld accélère la collecte d’expériences jusqu’à 14,6 fois par rapport à une exécution standard en mode mono-nœud et séquentiel. Ce gain de vitesse critique rend l’apprentissage par renforcement à grande échelle à la fois pratique et évolutif. En exploitant cette capacité, nous avons entraîné un agent basé sur Qwen3-32B, qui surpasse significativement son modèle de base, passant de 21,59 % à 32,23 % de précision globale sur GAIA. Sur les niveaux les plus exigeants du benchmark, notre agent atteint un score de 16,33 %, dépassant ainsi les performances des modèles propriétaires les plus avancés. Notre système open source et l’agent qu’il a permis de développer constituent une solution concrète et reproductible pour toute une chaîne d’entraînement d’IA agente, de l’interaction efficace à l’amélioration mesurable du modèle.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.