HyperAI

vor 25 Tagen

Auf der GTC Taipei hat NVIDIA offiziell bekannt gegeben, dass die nächste Plattformgeneration „Vera Rubin" nun vollständig in die Massenproduktion übergegangen ist. Als neue Infrastruktur für agentic AI nutzt Vera Rubin eine offene, rack-level-basierte MGX-Architektur und integriert tiefgreifend Vera Rubin NVL72, Vera-CPU, Groq 3 LPX sowie BlueField-4 STX und Spectrum-6 SPX zu einer vollständigen Basis für das AI Factory-Konzept. Im Vergleich zur Vorgängergeneration Grace Blackwell steigert sich der Agent Throughput in skalierbaren Szenarien um bis zum Zehnfachen. Die Lieferkette beschleunigt ihre Expansion ebenfalls: Führende Serverhersteller wie Dell, HPE, Lenovo und Supermicro haben bereits mit der Großserienfertigung begonnen. Allein auf Taiwan sind mehr als 150 Partnerunternehmen und über 350 Produktionsstätten aus insgesamt 30 Ländern eingebunden, die gemeinsam vorantreiben. Das Netzwerkarchitekturkonzept erfährt ein erhebliches Upgrade. Mit dem ersten Einsatz von Spectrum-X-Ethernet-Photonik-Switchern setzt Vera Rubin erstmals auf CPO-Technologie und 200-Gb/s-Serdes. Dies führt zu einem fünfmal niedrigeren Stromverbrauch, einer fünffach längeren Laufzeit im KI-Betrieb und einer um den Faktor 1,3 schnelleren Bereitstellung – entscheidende Voraussetzungen für Cluster mit Millionen GPUs. In Kombination mit BlueField-4-DPUs, die Datenraten von 800 Gbit/s unterstützen, ermöglicht die Plattform mehrlagige Mandantenisolation sowie Zero-Trust-Netzwerkrichtlinien. Im Bereich Sicherheit und Betrieb verfügt Vera Rubin über einen durchgängigen Stack vertraulicher Berechnung („Confidential Computing") und bietet hardwareseitig vertrauenswürdige Ausführungsumgebungen auf Rachebene sowie Ende-zu-Ende-Verschlüsselung. Das begleitende Software-Framework DOCA zusammen mit dem Design-and-Ops-Plattform DSX automatisiert die Steuerung sicherheitsrelevanter Richtlinien und optimiert gleichzeitig den Energieverbrauch. Damit unterstützt es Unternehmen dabei, AI Factories kosteneffizient unter Minimierung der Tokenkosten schnell bereitzustellen und zu betreiben, wodurch die Infrastrukturentwicklung vom Status „verfügbar" hin zu „skalierbar autonom" weiterentwickelt wird.

Diese Berichterstattung wurde mithilfe von KI zusammengestellt, um Branchen-Updates effizient bereitzustellen. Sie stellt weder Meinungen noch Beratung dar.

Verwandte Links

Verwandte Links

Verwandte Links

Online-Tutorial | UC Berkeley/NVIDIA Und Andere Veröffentlichen Gsplat, Eine Open-Source-3DGS-Bibliothek, Die 4x GPU-Speicher Spart Und Die Trainingszeit Um 10% reduziert.

Online-Tutorial | UC Berkeley/NVIDIA Und Andere Veröffentlichen Gsplat, Eine Open-Source-3DGS-Bibliothek, Die 4x GPU-Speicher Spart Und Die Trainingszeit Um 10% reduziert.

Command Palette

NVIDIA Vera Rubin startet die Massenproduktion und beschleunigt den Einsatz globaler Infrastruktur für verkörperten KI

Verwandte Links

Command Palette

NVIDIA Vera Rubin startet die Massenproduktion und beschleunigt den Einsatz globaler Infrastruktur für verkörperten KI

Verwandte Links

Command Palette

NVIDIA Vera Rubin startet die Massenproduktion und beschleunigt den Einsatz globaler Infrastruktur für verkörperten KI

Verwandte Links

Online-Tutorial | UC Berkeley/NVIDIA Und Andere Veröffentlichen Gsplat, Eine Open-Source-3DGS-Bibliothek, Die 4x GPU-Speicher Spart Und Die Trainingszeit Um 10% reduziert.

Online-Tutorial | UC Berkeley/NVIDIA Und Andere Veröffentlichen Gsplat, Eine Open-Source-3DGS-Bibliothek, Die 4x GPU-Speicher Spart Und Die Trainingszeit Um 10% reduziert.