Nex-N1 : Modèles agents entraînés via un écosystème unifié pour la construction à grande échelle d’environnements
Nex-N1 : Modèles agents entraînés via un écosystème unifié pour la construction à grande échelle d’environnements

Résumé
L’évolution des grands modèles linguistiques (LLM) passant de répondeurs passifs à des agents autonomes exige un changement fondamental des paradigmes d’apprentissage — du simple apprentissage par imitation statique vers une prise de décision pilotée par des incitations. Toutefois, cette transition est fortement entravée par l’absence d’infrastructures évolutives capables de générer des signaux d’interaction de haute qualité pour un apprentissage efficace des politiques. Pour remédier à ce défi, nous proposons une méthode complète visant à échelonner de manière systématique la diversité et la complexité des environnements interactifs. Notre approche réalise cet échelonnement en traitant trois dimensions orthogonales : (1) Complexité : NexAU, un cadre d’agents flexible permettant la construction d’hiérarchies d’agents complexes via des configurations simples ; (2) Diversité : NexA4A génère automatiquement des hiérarchies d’agents diversifiées à partir de langage naturel, couvrant ainsi des domaines infinis ; (3) Fidélité : NexGAP réduit le fossé entre simulation et réalité en intégrant des environnements réels dynamiques pour la synthèse de trajectoires ancrées dans le monde réel. Nous entraînons Nex-N1 sur les environnements interactifs complexes et diversifiés construits par notre infrastructure. Les résultats expérimentaux sur des benchmarks tels que SWE-bench et tau2 montrent que Nex-N1 dépasse de manière cohérente les modèles open-source de pointe (SOTA) et atteint des performances compétitives face aux modèles propriétaires les plus avancés sur des tâches agenty complexes. Nous rendons publiques l’écosystème Nex ainsi que les poids du modèle afin de faciliter les recherches ultérieures.
Dépôts de code
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.