GTC 2025 : Plus Que De Simples Puces, Jensen Huang a Dévoilé Plusieurs Nouvelles Réalisations En IA Physique En Une Demi-heure, Toutes Open Source

Le 18 mars, heure de Pékin, NVIDIA GTC 2025, qui est devenu un événement de l'industrie de l'IA, a débuté, mais peut-être en raison du manque de produits à succès, Le forum et l'exposition hors ligne du premier jour n'ont pas inversé la baisse du cours de l'action Nvidia.Il y a même eu un déclin. C'est pourquoi le « discours d'ouverture », qui a déjà suscité beaucoup d'attention, a reçu encore plus d'attention et d'attentes.
Certes, les fluctuations du cours de l’action Nvidia ne sont pas seulement liées à la spéculation sur la « baisse de la demande de puissance de calcul » provoquée par DeepSeek, mais sont également plus ou moins affectées par la correction du marché boursier américain. Mais quelle que soit la raison, en tant que dirigeant de l'entreprise, Huang Renxun doit restaurer la confiance des investisseurs le plus rapidement possible. C’est pourquoi nous l’avons vu dire ce qui suit dans son discours de près de trois heures :
* La loi d’échelle a été mentionnée à plusieurs reprises ;
* Rejoindre le mouvement open source, en publiant le modèle d'inférence NVIDIA Llama Nemotron construit sur le modèle Llama ;
* Il a salué le fait que Blackwell soit entièrement mis en production et que « la capacité de production augmente à une vitesse incroyable et la demande des clients est également impressionnante » ;
* Souligner explicitement que « l’effort de calcul » dans le domaine de l’IA a considérablement augmenté en raison de l’émergence des modèles d’inférence ;
* …
Mais le discours passionné de Huang semble avoir eu peu d’effet.Au moment de la mise sous presse, le cours de l'action Nvidia est toujours sur une tendance à la baisse.
Dans un sens, cela montre également que les mises à jour matérielles et architecturales qui ont fuité n’ont pas reçu beaucoup de faveur du marché. En plus de Blackwell Ultra et Vera Rubin,L'IA physique partagée par Huang Renxun au cours de la dernière demi-heure pourrait être une autre « bonne histoire » adaptée à un partage approfondi avec les investisseurs et l'industrie.
Une explosion de nouvelles réalisations en IA physique en une demi-heure
Au CES 2025, qui a ouvert ses portes début janvier 2025, NVIDIA a dévoilé le modèle de base mondial Cosmos.Huang Renxun a crié que « la prochaine frontière de l'IA est la physique ».D’un seul coup, cela a propulsé l’IA physique au premier plan de l’IA. L’IA dite physique consiste à permettre aux systèmes autonomes tels que les robots, les voitures autonomes et les espaces intelligents de percevoir, de comprendre et d’effectuer des opérations complexes dans le monde réel.
Au petit matin du 19 mars, à la fin du discours d'ouverture, l'apparition du petit robot Blue a poussé l'atmosphère à son paroxysme avec des acclamations constantes. L’interaction entre les deux parties nous permet également de définir les grandes lignes de l’IA physique.
Blue et Jen-Hsun Huang sur scène
Au cours de la dernière demi-heure, Huang Renxun a diffusé de manière intensive une série de nouvelles à succès.
La première consiste à lancer un ensemble de données d’IA physique open source.Fournissant aux développeurs 15 To de données, dont des milliers d'heures de vidéo multi-caméras, plus de 320 000 trajectoires pour la formation des robots et jusqu'à 1 000 descriptions de scènes générales (OpenUSD), il excelle en termes de diversité, d'échelle et de couverture géographique, et sera particulièrement bénéfique pour le domaine de la recherche en sécurité car il peut identifier les valeurs aberrantes et évaluer les performances de généralisation des modèles. Il convient de mentionner que NVIDIA a officiellement déclaré que l'ensemble de données continuera de s'étendre au fil du temps et pourrait devenir le plus grand ensemble de données d'IA physique open source unifiée au monde.
* Adresse de téléchargement du jeu de données :
Vient ensuite le premier modèle de base open source et entièrement personnalisable au monde, le NVIDIA Isaac GR00T N1.Utilisé pour imiter le raisonnement humain et d’autres compétences. Le modèle de base GR00T N1 présente une architecture à double système inspirée des principes de la cognition humaine. Le « Système 1 » est un modèle d’action à réflexion rapide qui reflète les réflexes conditionnés ou l’intuition humaine. Le système 2 est un modèle de réflexion lente utilisé pour une prise de décision réfléchie et méthodique.
Le troisième est de lancer Newton, un moteur physique open source pour la simulation de robots.Il sera développé conjointement par NVIDIA, Google DeepMind et Disney Research, sur la base de la bibliothèque d'accélération NVIDIA CUDA-X NVIDIA Warp, offrant aux développeurs un moyen simple d'écrire des programmes de noyau accélérés par GPU pour simuler l'intelligence artificielle, la robotique et l'apprentissage automatique (ML).

Enfin, le modèle de base du monde Cosmos a été mis à jour, introduisant un modèle de raisonnement open source et entièrement personnalisable.Conçu spécifiquement pour le développement de l'IA physique. dans,Cosmos Transfer est utilisé pour générer des données synthétiques,Il reçoit des entrées vidéo structurées telles que des cartes de segmentation, des cartes de profondeur, des analyses lidar, des cartes d'estimation de pose et des cartes de trajectoire pour générer des sorties vidéo réalistes contrôlables. Cosmos Predict pour la génération d'un monde intelligent,La génération multi-images sera prise en charge, prédisant des actions intermédiaires ou des trajectoires de mouvement à partir d'une image d'entrée de départ et de fin. Cosmos Reason est utilisé pour améliorer l'efficacité de l'annotation et de l'organisation des données de l'IA physique.Optimisez les modèles existants basés sur le monde ou créez des modèles d'action de langage visuel entièrement nouveaux.
Du calcul accéléré à la science accélérée
Outre l'IA physique, la position de NVIDIA dans le domaine de l'IA pour la science continue de s'approfondir, ce qui pourrait devenir un nouveau point de croissance à l'avenir.
La relation de NVIDIA avec l'IA pour la science remonte peut-être à la naissance de CUDA, qui a commencé avec la puissante combinaison du calcul accéléré et du calcul haute performance (HPC). Huang Renxun a dit un jour :Depuis la création de CUDA, NVIDIA a réduit le coût de l'informatique d'un millionième de son coût précédent.Pour certains, NVIDIA est un microscope informatique qui leur permet de voir les plus petites choses ; pour d’autres, c’est un télescope qui leur permet d’explorer des galaxies inimaginablement lointaines ; et pour beaucoup, c’est une machine à remonter le temps qui leur permet de poursuivre l’œuvre de leur vie pendant qu’ils en ont encore le temps.
En d’autres termes, c’est la combinaison écologique de CUDA et du GPU NVIDIA qui a considérablement amélioré les capacités de calcul parallèle et accéléré l’application du calcul haute performance dans le domaine de la recherche scientifique. Aujourd’hui, l’IA a donné un élan puissant au secteur de la recherche scientifique, en passant du calcul accéléré à la science accélérée. NVIDIA se trouve au centre de cette tempête de changement technologique et devrait être suffisamment prévoyant pour saisir cette opportunité.
Lors du discours d'ouverture du GTC 2025 qui vient de se terminer, Huang Renxun a annoncé que les développeurs peuvent désormais utiliser CUDA-X et la dernière architecture de superpuce pour obtenir une intégration et une coordination automatiques plus étroites entre les ressources CPU et GPU, rendant leurs outils d'ingénierie informatique 11 fois plus rapides et 5 fois plus puissants en termes de calcul que l'utilisation d'architectures informatiques accélérées traditionnelles.
Huang a conclu :CUDA-X apporte déjà des capacités de calcul accéléré à une gamme de nouvelles disciplines d’ingénierie, notamment l’astronomie, la physique des particules, la physique quantique, l’automobile, l’aérospatiale et la conception de semi-conducteurs.
Lors de la conférence GTC 2018,NVIDIA a dévoilé sa première plateforme d'IA, NVIDIA Clara, destinée à l'industrie médicale.Initialement axée sur le domaine de l'imagerie médicale, elle fournit des solutions d'IA basées sur GPU pour accélérer le traitement des données d'images médicales. En 2019, NVIDIA Clara s'est encore élargi pour inclure la nouvelle plateforme de calcul génomique Clara Genomics, qui est utilisée pour l'analyse des séquences ADN/ARN et le traitement accéléré des données génétiques.
Fin 2019, NVIDIA a acquis Parabricks, une société de développement de logiciels de séquençage génétique, et a intégré ses outils de séquençage génétique accélérés par GPU dans la plateforme NVIDIA Clara. Selon la documentation officielle de NVIDIA,Parabricks peut analyser 30 fois l'ensemble des données du génome humain en 10 minutes.Les autres méthodes prennent 30 heures.
Lors de la conférence GTC 2021,NVIDIA lance Clara Holoscan, une plateforme de calcul d'IA en temps réel dédiée aux dispositifs médicaux.L’objectif est de permettre aux équipements médicaux de disposer de capacités de calcul d’IA en temps réel, améliorant ainsi le niveau d’intelligence de l’analyse d’images médicales, de l’assistance chirurgicale et de la télémédecine.
Lors de la conférence GTC qui s'est tenue en septembre 2022, NVIDIA a encore étendu Clara et lancé BioNeMo. À cette époque, le projet de NVIDIA en matière d'IA pour la science est devenu de plus en plus clair, du calcul accéléré par l'IA à l'IA générative, et de la plate-forme d'IA d'imagerie médicale initiale à la recherche plus approfondie en sciences de la vie. Spécifiquement,BioNeMo est un framework pour la formation et le déploiement de grands modèles de langage biomoléculaire à une échelle de calcul ultra-large.Contient 4 modèles de langage pré-entraînés :
* Protéine LLM ESM-1 : elle traite les séquences d'acides aminés et génère des représentations qui peuvent être utilisées pour prédire diverses propriétés et fonctions des protéines, améliorant ainsi la capacité des scientifiques à comprendre la structure des protéines.
* Version open source de l'outil de modélisation de protéines OpenFold.
* Modèle de chimie générative MegaMolBART : peut être utilisé pour la prédiction de réactions, l'optimisation moléculaire et la génération de nouvelles molécules.
* ProtT5 : Développé par RostLab de l'Université technique de Munich en collaboration avec NVIDIA, il étend les fonctionnalités des LLM protéiques de Meta AI tels que ESM-1b à la génération de séquences.
En plus de la recherche médicale et des sciences de la vie,NVIDIA a également lancé la plateforme cloud jumelle numérique climatique Earth-2 lors de la GTC 2024.Grâce à son nouveau modèle d'IA générative CorrDiff, associé à NVIDIA FourCastNet, la simulation du climat mondial peut être réalisée à l'échelle d'un kilomètre.
Conclusion
Chaque conférence GTC est depuis longtemps passée du statut de « promotion » de nouveaux produits et technologies à celui de référence du secteur. Lors de la conférence de cette année, nous avons pu constater les attentes de Huang Renxun concernant la prochaine génération d'architecture et de produits de puces, ainsi que sa présence active dans les domaines de la robotique, de la conduite autonome et de l'informatique scientifique. Il est évidemment trop tôt pour espérer que ce dernier devienne rapidement la principale banque d'approvisionnement de Nvidia, mais il est également assez difficile d'inverser rapidement le sentiment actuel du marché et d'éliminer les obstacles pour le premier. Attendons tous avec impatience de voir quels autres « tours fous » Huang va inventer à l’avenir.