NVIDIA DGX SuperPOD mit Rubin-Plattform für nächste AI-Revolution
NVIDIA hat auf der CES in Las Vegas die Rubin-Plattform vorgestellt, eine bahnbrechende Architektur für die nächste Generation künstlicher Intelligenz, die auf sechs neu entwickelten Chips basiert: dem NVIDIA Vera CPU, dem Rubin GPU, dem NVLink 6 Switch, dem ConnectX-9 SuperNIC, dem BlueField-4 DPU und dem Spectrum-6 Ethernet Switch. Diese Komponenten werden durch eine tiefgreifende Co-Design-Strategie miteinander verbunden, um die Leistung bei der Training und insbesondere bei der Inference zu steigern – besonders für agente AI, Mixture-of-Experts-Modelle und langen Kontext-Reasoning. Die Rubin-Plattform ist der Kern der neuen NVIDIA DGX SuperPOD-Systeme, die als maßgeschneiderte Infrastruktur für große Unternehmen und Forschungseinrichtungen dienen. Die DGX SuperPOD-Architektur integriert die gesamte Technologiekette – von Rechenleistung über Netzwerke bis hin zu Software – als ein kohärentes System, wodurch der Aufwand für die Infrastrukturintegration entfällt und Teams sich auf Innovation und Geschäftsergebnisse konzentrieren können. Zwei Hauptkonfigurationen werden angeboten: Der DGX Vera Rubin NVL72 vereint acht Systeme mit insgesamt 576 Rubin-GPUs und erreicht 28,8 Exaflops bei FP4-Genauigkeit sowie 600 TB schnellen Speicher. Durch 260 TB/s NVLink-Durchsatz wird ein einheitlicher Speicher- und Rechenraum über den gesamten Rack hinweg ermöglicht, wodurch Modelle nicht mehr partitioniert werden müssen. Der DGX Rubin NVL8 bietet eine flüssiggekühlte Variante mit acht Rubin-GPUs pro System und sechster Generation NVLink, was eine 5,5-fache Steigerung der NVFP4-FLOPS gegenüber Blackwell-Systemen bedeutet. Beide Systeme sind Teil einer skalierbaren Lösung, die für den Einsatz in der industriellen AI-Revolution konzipiert ist. Die neue Netzwerkinfrastruktur mit Spectrum-6, Quantum-X800 InfiniBand, BlueField-4 und ConnectX-9 SuperNIC sorgt für eine 800 Gb/s-End-to-End-Verbindung, die die traditionellen Engpässe bei Skalierung, Stau und Zuverlässigkeit beseitigt. Durch intelligente Kongestionssteuerung und Leistungsisolation wird die Datenzentrum-Infrastruktur zu einer Hochleistungs-AI-Fabrik, die Gigawatt-leistungsfähig und extrem effizient ist. Die Software-Plattform NVIDIA Mission Control wird für Rubin-basierte Systeme verfügbar, um die Operation, Orchestrierung und Wartung von Rechenzentren zu automatisieren. Sie unterstützt Echtzeit-Überwachung, Leckerkennung, autonome Wiederherstellung und Energie- und Kühleffizienz. Die NVIDIA AI Enterprise-Software, einschließlich NIM-Mikroservices und der Nemotron-3-Modelle, ermöglicht eine nahtlose Integration in bestehende Entwicklungs- und Bereitstellungsprozesse. Die neuen DGX SuperPOD-Systeme mit Rubin-Architektur werden ab dem zweiten Halbjahr 2025 verfügbar sein. Industrieexperten sehen in der Rubin-Plattform einen Meilenstein für die industrielle AI-Transformation. „Dies ist nicht nur eine Hardware-Verbesserung, sondern eine ganzheitliche Neugestaltung der AI-Infrastruktur“, sagt ein Analyst von Gartner. NVIDIA positioniert sich damit als führender Anbieter für skalierbare, effiziente und intelligente AI-Fabriken. Die Integration von Rechenleistung, Netzwerk und Software in einem einzigen, konsistenten Ökosystem macht die DGX SuperPOD-Plattform zu einer unverzichtbaren Basis für die Entwicklung von frontier AI-Systemen.
