NVIDIA dévoile des modèles d’intelligence avancée pour accélérer l’ère des agents AI et de la robotique physique
Les agents intelligents basés sur l’IA devraient générer jusqu’à 450 milliards de dollars de gains de revenus et d’économies de coûts d’ici 2028, selon Capgemini. Face à cette transformation, des entreprises comme CrowdStrike, Uber, Zoom, Magna, NetApp et Amdocs s’engagent massivement dans le développement d’agents autonomes grâce aux nouveaux modèles de raisonnement NVIDIA Nemotron et Cosmos, présentés lors de SIGGRAPH. Ces modèles, conçus pour l’IA d’entreprise et l’IA physique, permettent une prise de décision plus autonome, plus rapide et plus précise. NVIDIA a lancé deux nouvelles versions de ses modèles Nemotron : Nemotron Nano 2 et Llama Nemotron Super 1.5. Ces modèles offrent la meilleure précision dans leur catégorie pour des tâches complexes telles que le raisonnement scientifique, les mathématiques, la programmation, l’appel d’outils, le suivi d’instructions et les échanges conversationnels. Grâce à une architecture hybride, des modèles quantifiés compacts et un « budget de réflexion » configurable, ils réduisent les coûts de raisonnement de 60 % tout en augmentant la productivité. Nemotron Nano 2 génère jusqu’à 6 fois plus de tokens que les modèles concurrents de taille similaire, tandis que Llama Nemotron Super 1.5 en version NVFP4 offre une performance 6 fois supérieure sur les GPU NVIDIA B200 par rapport aux H100. Parallèlement, NVIDIA a dévoilé Cosmos Reason, un modèle de vision-langage (VLM) à raisonnement structuré conçu pour l’IA physique. Doté de 7 milliards de paramètres, il comprend une compréhension du monde réel — physique, spatiale, temporelle — permettant aux robots et aux systèmes autonomes de raisonner comme des humains. Il sert de moteur de décision pour les modèles VLA (Vision-Language-Action), améliore la qualité des données d’entraînement par critique et annotation, et permet aux agents visuels d’analyser des scénarios complexes dans des environnements dynamiques comme les usines, les villes ou les routes. Les entreprises utilisent ces modèles pour des applications concrètes : Zoom exploite Nemotron pour renforcer son assistant AI Companion dans les réunions et documents ; CrowdStrike teste les modèles pour permettre à ses agents Charlotte d’interagir avec la plateforme Falcon ; NetApp les utilise pour analyser des données métier ; EY les déploie pour des tâches de gestion fiscale et de risque ; et DataRobot les intègre à sa plateforme de gestion des agents. Dans le domaine de l’IA physique, Uber utilise Cosmos Reason pour analyser le comportement des véhicules autonomes et évaluer des scénarios comme les traversées de piétons. Centific, VAST et Ambient.ai l’exploitent pour améliorer la sécurité industrielle, la surveillance urbaine et la détection d’équipements de protection. Magna le développe pour son système de livraison autonome, permettant aux véhicules d’adapter rapidement leurs trajectoires à de nouvelles villes. Tous ces modèles seront disponibles via des microservices NVIDIA NIM, offrant sécurité, contrôle et déploiement sur toute infrastructure NVIDIA-accelérée. Ils seront également accessibles via AWS Bedrock, SageMaker, Azure AI Foundry, Oracle Data Science et Google Vertex AI. Des versions préliminaires sont déjà disponibles sur Hugging Face et GitHub. Les experts saluent cette avancée : selon des analystes du secteur, ces modèles marquent une rupture dans la capacité des systèmes à raisonner de manière autonome, combinant efficacité, précision et scalabilité. NVIDIA s’impose ainsi comme un acteur clé dans l’écosystème des agents intelligents, en combinant puissance de calcul, données ouvertes et outils d’intégration robustes.