Production à grande échelle du NVIDIA Vera Rubin lancée pour accélérer le déploiement mondial de l'infrastructure d'intelligence artificielle incarnée
Au cours de la conférence GTC Taipei, NVIDIA a officiellement annoncé que sa prochaine plateforme, Vera Rubin, est entrée en phase de production à grande échelle. Nouvelle infrastructure conçue pour l'IA agentielle, Vera Rubin s'appuie sur une architecture au niveau du rack open-source MGX et intègre étroitement les composants suivants : Vera Rubin NVL72, processeur Vera CPU, Groq 3 LPX, BlueField-4 STX ainsi que Spectrum-6 SPX, formant ainsi un socle complet d'usine IA. Par rapport à la génération précédente Grace Blackwell, le débit des agents dans des scénarios de mise à l'échelle augmente jusqu'à dix fois. La chaîne logistique accélère également son rythme. Les principaux fabricants de serveurs tels que Dell, HPE, Lenovo et Supermicro ont lancé leur fabrication massive ; rien qu'en Taïwan, plus de 150 partenaires et plus de 350 usines collaborent depuis 30 pays différents. Une évolution majeure touche également l'architecture réseau. Vera Rubin lance dès ses débuts le commutateur Spectrum-X Ethernet Photonique, qui adopte la technologie CPO et des SerDes à 200 Go/s, réduisant la consommation énergétique par cinq tout en prolongeant la durée d'exécution de l'IA de cinq fois et en améliorant la vitesse de déploiement de 1,3 fois, ouvrant ainsi la voie aux grappes de millions de GPU. Associé au DPU BlueField-4 prenant en charge 800 Go/s, cette plateforme permet une isolation multi-niveaux des locataires et met en œuvre des stratégies de réseau « zero trust ». Sur le plan de la sécurité et des opérations, Vera Rubin intègre nativement une solution complète de calcul confidentiel, offrant un environnement d'exécution sûr au niveau matériel au niveau du rack ainsi qu'un cryptage de bout en bout. Grâce à la pile logicielle DOCA et à la plate-forme opérationnelle et de conception DSX, il devient possible de déployer automatiquement les politiques de sécurité et d'optimiser la consommation énergétique, aidant ainsi les entreprises à déployer et exploiter rapidement leurs usines IA avec un coût minimal par jeton, faisant évoluer l'infrastructure vers un stade où elle n'est pas seulement utilisable mais capable d'autonomie à grande échelle.
