NVIDIA Vera Rubin startet die Massenproduktion und beschleunigt den Einsatz globaler Infrastruktur für verkörperten KI
Auf der GTC Taipei hat NVIDIA offiziell bekannt gegeben, dass die nächste Plattformgeneration „Vera Rubin" nun vollständig in die Massenproduktion übergegangen ist. Als neue Infrastruktur für agentic AI nutzt Vera Rubin eine offene, rack-level-basierte MGX-Architektur und integriert tiefgreifend Vera Rubin NVL72, Vera-CPU, Groq 3 LPX sowie BlueField-4 STX und Spectrum-6 SPX zu einer vollständigen Basis für das AI Factory-Konzept. Im Vergleich zur Vorgängergeneration Grace Blackwell steigert sich der Agent Throughput in skalierbaren Szenarien um bis zum Zehnfachen. Die Lieferkette beschleunigt ihre Expansion ebenfalls: Führende Serverhersteller wie Dell, HPE, Lenovo und Supermicro haben bereits mit der Großserienfertigung begonnen. Allein auf Taiwan sind mehr als 150 Partnerunternehmen und über 350 Produktionsstätten aus insgesamt 30 Ländern eingebunden, die gemeinsam vorantreiben. Das Netzwerkarchitekturkonzept erfährt ein erhebliches Upgrade. Mit dem ersten Einsatz von Spectrum-X-Ethernet-Photonik-Switchern setzt Vera Rubin erstmals auf CPO-Technologie und 200-Gb/s-Serdes. Dies führt zu einem fünfmal niedrigeren Stromverbrauch, einer fünffach längeren Laufzeit im KI-Betrieb und einer um den Faktor 1,3 schnelleren Bereitstellung – entscheidende Voraussetzungen für Cluster mit Millionen GPUs. In Kombination mit BlueField-4-DPUs, die Datenraten von 800 Gbit/s unterstützen, ermöglicht die Plattform mehrlagige Mandantenisolation sowie Zero-Trust-Netzwerkrichtlinien. Im Bereich Sicherheit und Betrieb verfügt Vera Rubin über einen durchgängigen Stack vertraulicher Berechnung („Confidential Computing") und bietet hardwareseitig vertrauenswürdige Ausführungsumgebungen auf Rachebene sowie Ende-zu-Ende-Verschlüsselung. Das begleitende Software-Framework DOCA zusammen mit dem Design-and-Ops-Plattform DSX automatisiert die Steuerung sicherheitsrelevanter Richtlinien und optimiert gleichzeitig den Energieverbrauch. Damit unterstützt es Unternehmen dabei, AI Factories kosteneffizient unter Minimierung der Tokenkosten schnell bereitzustellen und zu betreiben, wodurch die Infrastrukturentwicklung vom Status „verfügbar" hin zu „skalierbar autonom" weiterentwickelt wird.
