HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA lance la famille Nemotron 3 : des modèles open source révolutionnaires pour l’IA agente à grande échelle

NVIDIA a annoncé la sortie de la famille de modèles open source Nemotron 3, conçue pour accélérer le développement d’agents IA transparents, efficaces et spécialisés à grande échelle. Cette nouvelle gamme, composée de trois tailles — Nano, Super et Ultra — repose sur une architecture hybride de mixture of experts (MoE) en espace latent, offrant des performances supérieures pour les systèmes multi-agents complexes. Face à l’évolution des chatbots unidimensionnels vers des systèmes collaboratifs d’agents IA, les développeurs rencontrent des défis majeurs : surcharge de communication, dérive de contexte et coûts élevés d’inférence. Le Nemotron 3 répond directement à ces enjeux en combinant transparence, efficacité et scalabilité, tout en s’inscrivant dans la stratégie d’IA souveraine de NVIDIA, adoptée par des organisations en Europe, en Corée du Sud et ailleurs. Des acteurs clés comme Accenture, Cadence, CrowdStrike, Perplexity, ServiceNow, Palantir, Oracle Cloud Infrastructure, Siemens, Synopsys et Zoom s’apprêtent à intégrer ces modèles pour moderniser leurs flux de travail dans des secteurs variés : cybersécurité, fabrication, développement logiciel, médias, etc. Bill McDermott, PDG de ServiceNow, souligne que cette collaboration avec NVIDIA permet de « définir la norme en matière d’automatisation intelligente, avec une efficacité, une vitesse et une précision inégalées ». Aravind Srinivas, CEO de Perplexity, ajoute que le routeur d’agents de leur plateforme peut désormais allouer les tâches entre les modèles ouverts comme Nemotron 3 Ultra et les modèles propriétaires de pointe, optimisant à la fois l’intelligence et la rentabilité. La version Nemotron 3 Nano, déjà disponible, se distingue par son efficacité computationnelle. Grâce à son architecture hybride MoE, elle offre jusqu’à 4 fois plus de débit de tokens que sa prédécesseure, réduit de 60 % la génération de tokens lors des raisonnements, et dispose d’une fenêtre contextuelle de 1 million de tokens, améliorant sa capacité à traiter des tâches complexes sur plusieurs étapes. Classé comme le modèle le plus ouvert et efficace de sa catégorie par Artificial Analysis, il s’impose comme un outil idéal pour le débogage logiciel, la synthèse de contenu ou l’assistance IA. Nemotron 3 Super et Ultra, attendus en première moitié 2026, ciblent des applications exigeant une coordination fine entre agents (Super) ou un raisonnement profond (Ultra). Tous les modèles exploitent le format d’entraînement 4-bit NVFP4 sur l’architecture Blackwell de NVIDIA, réduisant drastiquement la consommation mémoire sans perte de précision. Par ailleurs, NVIDIA a lancé un ensemble d’outils open source : des jeux de données de 3 billions de tokens (pré-entraînement, post-entraînement, apprentissage par renforcement), le dataset de sécurité agentic, ainsi que les bibliothèques NeMo Gym, NeMo RL et NeMo Evaluator, disponibles sur GitHub et Hugging Face. Ces ressources accélèrent le développement, l’évaluation et la sécurisation des agents IA. Nemotron 3 Nano est accessible via Hugging Face, des fournisseurs de services d’inférence (Baseten, DeepInfra, Fireworks, etc.) et des plateformes cloud (AWS via Amazon Bedrock, Google Cloud, Microsoft Foundry, etc.). Il est également disponible en tant que microservice NIM sur infrastructure NVIDIA pour une sécurité maximale. Les versions Super et Ultra seront déployées en 2026. Cette initiative renforce l’écosystème open source de NVIDIA, soutenu par des programmes comme Inception, permettant aux startups de développer rapidement des agents IA spécialisés, avec l’appui d’un écosystème technologique et d’un réseau d’infrastructure étendu.

Liens associés