HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA équipe gagne la compétition ARC Prize 2025 sur le chemin de l’AGI avec une solution économique et innovante

Des chercheurs NVIDIA ont remporté un concours clé sur Kaggle, considéré par de nombreux experts comme un indicateur en temps réel des progrès vers l’intelligence artificielle générale (IAG). Ivan Sorokin et Jean-François Puget, deux membres du groupe Kaggle Grandmasters of NVIDIA (KGMoN), ont terminé en tête du classement public du Kaggle ARC Prize 2025 avec un score de 27,64 %, en développant une solution évaluée sur le même jeu de données que la référence ARC-AGI-2. Après la fin du concours, l’équipe, qui s’est baptisée NVARC, a amélioré ses performances à 29,72 %, tout en garantissant une efficacité économique remarquable : seulement 20 cents par tâche. Leur modèle fine-tuné de 4 milliards de paramètres a surpassé des modèles bien plus volumineux et coûteux, démontrant non seulement des résultats de pointe, mais aussi une avancée majeure en matière de raisonnement IAG à faible coût et à grande échelle. Le benchmark ARC-AGI évalue la capacité des systèmes d’IA à raisonner de manière abstraite et à généraliser à partir de très peu d’exemples, à l’aide de casse-têtes visuels basés sur des grilles. ARC-AGI-2, version plus exigeante et mise à jour, élimine tout chevauchement avec les données d’entraînement publiques, et est spécifiquement conçu pour résister aux raccourcis, à la mémoire brute ou à l’exploitation de motifs. Cela en fait un test plus rigoureux de la véritable abstraction systématique. Ce benchmark est devenu l’un des indicateurs les plus surveillés de l’évolution réelle du raisonnement général en IA. Contrairement aux benchmarks classiques, les tâches ARC-AGI ne peuvent pas être résolues par la simple augmentation de la taille des modèles, la mémoire ou l’analyse de motifs. Chaque énigme est une petite grille avec seulement quelques exemples, obligeant le système à déduire une règle abstraite et à l’appliquer à un cas test inédit. Les scores sur ARC-AGI-2 sont donc largement considérés comme un indicateur fiable de la capacité d’un système à apprendre à partir de presque rien. C’est précisément pour cette raison que le classement du Kaggle ARC Prize 2025 est si important : c’est l’un des rares espaces ouverts et reproductibles où les chercheurs testent le raisonnement IAG-style sous des contraintes strictes de temps et de ressources informatiques. La solution gagnante de NVARC n’a pas été alimentée par de grands modèles ou des recherches massives. Elle s’appuie sur trois principes accessibles à tout développeur : des données synthétiques, un apprentissage à l’évaluation (test-time training) et une ingénierie rigoureuse. Les méthodes classiques de raisonnement par grands modèles (comme le « chain-of-thought », l’utilisation d’outils ou les agents inspirés de l’apprentissage par renforcement) n’ont pas pu s’insérer dans les limites de temps de Kaggle. NVARC a donc inversé la stratégie : toute la complexité du raisonnement a été déplacée en amont, dans un pipeline de génération de données synthétiques, et des modèles plus légers ont été entraînés pour fonctionner rapidement au moment de l’évaluation. En utilisant une génération de puzzles en étapes, une décomposition des concepts et des modèles open-weight de plus en plus puissants, l’équipe a construit un corpus diversifié de tâches au style ARC. Les modèles finaux n’avaient plus qu’à reconnaître et adapter des motifs, sans avoir à exécuter des logiques de recherche de programme complexes. Le test-time training permet à chaque modèle d’apprendre les spécificités d’une énigme à partir de son petit ensemble d’exemples — une technique désormais essentielle pour atteindre les meilleurs résultats sur ARC-AGI. Le résultat est un ensemble compact et très économique, qui a surpassé des systèmes bien plus gros, marquant une nouvelle étape dans le développement du raisonnement artificiel. Pour construire cette solution, l’équipe a utilisé les outils de la suite NVIDIA NeMo, notamment NeMo RL pour l’apprentissage par renforcement évolutive, et NeMo Skills pour optimiser les pipelines de génération de données synthétiques. Pour en savoir plus, consulter le compte rendu technique de NVARC sur Kaggle.

Liens associés

NVIDIA équipe gagne la compétition ARC Prize 2025 sur le chemin de l’AGI avec une solution économique et innovante | Articles tendance | HyperAI