HyperAIHyperAI

Command Palette

Search for a command to run...

GTC 2026 | De Vera Rubin À NemoClaw : L’avenir De Nvidia S’étend-il Au-delà Des GPU ?

Featured Image

Lors de la conférence annuelle NVIDIA GTC, le discours d'ouverture du PDG Jensen Huang est toujours considéré comme un indicateur important de l'industrie mondiale de l'IA. De l'architecture GPU de nouvelle génération au développement de l'écosystème logiciel, ce discours annonce souvent les technologies phares et les orientations de développement de l'infrastructure de calcul pour l'IA dans les années à venir.

Le 16 mars, heure locale, le discours d'ouverture de la GTC 2026 s'est tenu comme prévu. Jensen Huang, âgé de 63 ans, est apparu dans son emblématique veste en cuir et a présenté avec passion une série de nouveaux produits majeurs au stade de San Jose en Californie.

Pas seulement les GPU

En tant que « produit phare » de la feuille de route des puces IA de NVIDIA,La plateforme Vera Rubin a également suscité l'intérêt du public lors de la conférence GTC de cette année : elle se compose de 7 puces révolutionnaires, de 5 racks et d'un supercalculateur.Jensen Huang a qualifié cette avancée de véritable bond en avant technologique. Parmi les éléments les plus remarquables figurent le GPU Rubin, le NVIDIA Groq 3 LPX et le processeur NVIDIA Vera.

Le premier GPU présenté est le Rubin, une architecture inédite conçue spécifiquement pour l'IA agentique et dévoilée officiellement en janvier dernier. Il intègre un moteur Transformer de troisième génération avec compression adaptative accélérée par matériel, offrant une puissance de calcul NVFP4 de 50 pétaflops pour l'inférence IA et prenant en charge l'interconnexion complète NVLink 72.

Deuxièmement, il y a l'intégration de la technologie Groq chez NVIDIA. Depuis que Jensen Huang a dépensé 20 milliards de dollars pour acquérir une licence pour cette technologie fin 2025, on a spéculé sur le fait que cette décision visait à « abandonner les GPU au profit des LPU ». Désormais, la situation s'est stabilisée et les deux technologies ont développé une synergie et une complémentarité efficaces.

Dans les déploiements à grande échelle, les clusters LPU fonctionnent comme un processeur unique et massif, accélérant ainsi l'inférence rapide et déterministe. Associés à la Vera Rubin NVL72, les GPU Rubin et les LPU optimisent conjointement les performances de décodage en calculant chaque couche du modèle d'IA pour chaque jeton de sortie. C'est sur cette base qu'NVIDIA a introduit le rack LPX doté de 256 processeurs LPU, conçu spécifiquement pour répondre aux exigences de faible latence et de gestion de contexte étendu des systèmes multi-agents.Associé à Vera Rubin, il peut fournir jusqu'à 35 fois le débit d'inférence par mégawatt pour les modèles à mille milliards de paramètres.

Enfin, il y a le processeur NVIDIA Vera, le premier processeur au monde conçu pour l'ère de l'IA agentique et de l'apprentissage par renforcement.Son efficacité opérationnelle est deux fois supérieure à celle des processeurs rackables traditionnels, et sa vitesse de fonctionnement est plus rapide que celle du 50%.Elle permet d'obtenir un débit, une réactivité et une efficacité accrus pour les services d'IA à grande échelle, tels que les assistants de programmation et les agents intelligents destinés aux consommateurs et aux entreprises. Jensen Huang a déclaré : « Le processeur ne se contente plus de supporter les modèles, il les pilote. Grâce à des performances et une efficacité énergétique révolutionnaires, Vera permet aux systèmes d'IA de penser plus vite et d'évoluer plus efficacement. »

Sur cette base, NVIDIA a également lancé un tout nouveau rack pour processeurs Vera intégrant 256 processeurs Vera refroidis par liquide, prenant en charge plus de 22 500 environnements de processeurs simultanés, chacun pouvant fonctionner indépendamment à pleine vitesse.

Support pour processeur Vera, image provenant du site officiel de NVIDIA

Le lancement de Vera Rubin marque une nouvelle étape dans la compétitivité de NVIDIA à l'ère de l'IA agentique. De la puissance de calcul du processeur Vera à l'excellence en inférence du GPU Rubin, en passant par la révolution du stockage du DPU BlueField 4, NVIDIA repousse les limites de chaque maillon de la chaîne de production d'IA grâce à une conception collaborative optimale.

Pour les développeurs et les entreprises, si l'on profite des avantages d'une telle matrice de puces, massive et en constante amélioration, un défi plus pratique se pose : face à des modèles de GPU toujours plus complexes et à une multitude de mesures de puissance de calcul, comment s'affranchir des spécifications des fabricants et comparer objectivement les performances réelles des différents matériels ? Autrement dit, comment identifier avec précision l'option la plus adaptée à leurs besoins parmi un vaste choix ?

Compte tenu de cela,HyperAI a lancé une « liste de classement des GPU » afin de constituer une plateforme de référence pour la sélection et la prise de décision des GPU dans les scénarios d'IA/grands modèles/HPC.HyperAI prend en charge les comparaisons entre fournisseurs et architectures, en utilisant des règles de comparaison unifiées pour aider les utilisateurs à prendre des décisions techniques pertinentes et éclairées sur le marché complexe des accélérateurs GPU/IA. HyperAI assurera une veille technologique constante afin de fournir aux développeurs des outils pratiques adaptés aux charges de travail d'IA réelles.

Le nouveau comparatif de performances GPU de Rubin est disponible. Consultez le classement des GPU dès maintenant :

https://hyper.ai/gpu-leaderboard

NemoClaw : Optimisez OpenClaw avec une seule commande.

Suite à la publication de sa feuille de route pour les puces de nouvelle génération, NVIDIA a également fourni simultanément sa réponse à la « prochaine étape de l'IA » au niveau logiciel : NemoClaw.

« OpenClaw a ouvert la voie à une nouvelle ère de l'IA pour tous et est devenu le projet open source à la croissance la plus rapide de l'histoire », a déclaré Huang Renxun, faisant l'éloge du projet. « Mac et Windows sont les systèmes d'exploitation des ordinateurs personnels… »OpenClaw, en revanche, est un système d'exploitation pour l'IA personnelle.C’est le moment que toute l’industrie attendait : le début d’une nouvelle renaissance du logiciel.

NemoClaw utilise le logiciel NVIDIA Agent Toolkit pour optimiser OpenClaw en une seule commande.Cela l'intègre directement à l'écosystème NVIDIA. NemoClaw installe OpenShell, fournissant un modèle open source et un environnement sandbox isolé pour renforcer la confidentialité et la sécurité des données des agents autonomes. Cette solution dote les pinces d'une infrastructure sous-jacente qui leur faisait défaut jusqu'alors, leur permettant d'accéder aux ressources nécessaires à l'exécution de leurs tâches tout en étant protégées par des règles de sécurité, de réseau et de confidentialité. (Voir schéma ci-dessous.)

NemoClaw prend en charge l'utilisation de tout agent programmable. Grâce à son architecture d'agent ouverte, il peut invoquer des modèles open source (dont NVIDIA Nemotron) exécutés sur le système local de l'utilisateur. Simultanément, via un routeur de confidentialité, l'agent peut également accéder à des modèles de pointe exécutés dans le cloud.La combinaison de modèles locaux et cloud offre aux agents une base pour acquérir de nouvelles compétences et accomplir des tâches complexes dans le respect des contraintes de confidentialité et de sécurité établies.

Dans ce contexte, l'idée de Jensen Huang d'un « système d'exploitation d'IA personnel » trouve une voie plus claire vers sa mise en œuvre : les agents ne sont plus de simples interfaces pour appeler des modèles, mais de véritables exécutants numériques capables d'un fonctionnement à long terme et d'un apprentissage continu. Si les nouveaux GPU et l'architecture système fournissent la puissance de calcul nécessaire à cette vision, NemoClaw définit quant à lui le mode de fonctionnement de l'agent et les limites de sécurité au niveau logiciel. Ensemble, ils constituent le récit complet de NVIDIA sur les « usines à IA » et la « main-d'œuvre d'IA ».

Dans une certaine mesure, NemoClaw abaisse encore le seuil de développement d'OpenClaw. Cependant, pour les développeurs, la validation rapide des cas d'utilisation est tout aussi importante ; par conséquent,HyperAI fournit aux développeurs du monde entier un environnement d'exécution prêt à l'emploi et des notebooks en ligne.Vous pouvez commencer à construire votre propre agent d'IA sans configuration complexe.

Lien pour la course en ligne :
OpenClaw : Exécution d’appels API utilisant le processeur libre
https://hyper.ai/notebooks/49888

 Tutoriel d'exécution d'OpenClaw GPU
https://hyper.ai/notebooks/49890

Sans aucun doute, la conférence annuelle GTC est depuis longtemps considérée comme le grand rendez-vous incontournable de l'IA, une vitrine pour NVIDIA et une véritable référence en matière de technologies. De nombreux médias ont couvert cet événement exceptionnel, et les nombreuses nouveautés et mises à jour de modèles ont captivé l'attention du public. Dans les prochains jours, HyperAI continuera de partager des informations détaillées sur les modèles et jeux de données open source de haute qualité présentés lors de cette conférence, et proposera des expériences en ligne. Restez connectés !