Oracle erste bei AMDs MI450- und Helios-Systemen
Bei der diesjährigen Oracle OpenWorld CloudWorld AI World kündigte Oracle eine umfassende Zusammenarbeit mit AMD an, die den Start eines weltweit ersten öffentlichen AI-Überrechnungsclusters im Oracle Cloud Infrastructure (OCI) im dritten Quartal 2026 vorsieht. Dieser Cluster wird mit 50.000 AMD Instinct MI450-Serie-GPUs ausgestattet sein, die auf der neuen Altair-Architektur basieren. Die GPU-Plattform nutzt den „Helios“-Rack-Designansatz von AMD, der als direkter Konkurrent zu Nvidia’s „Oberon“-Racks angesehen wird. Die Helios-Racks sollen bis zu 72 GPUs pro Rack unterstützen und sind für die Skalierung auf 64 oder 128 GPUs ausgelegt, wobei die Version mit 128 GPUs (IF128) eine Leistung von 50 Petaflops pro GPU bei FP4-Präzision erreichen soll. Die MI450-Serie umfasst zwei Varianten: die MI450 als Einzel-GPU für klassische achtwege-Systeme und die MI450X für die skalierbaren Helios-Racks. Die MI450 verfügt über 432 GB HBM4-Speicher mit einer Bandbreite von 19,6 TB/s pro GPU und erreicht bei FP4 eine Spitzenleistung von etwa 40 Petaflops. In einem achtwege-System ergibt sich damit eine Gesamtleistung von 3,2 Exaflops bei FP4 und 3,4 TB HBM4-Speicher. Die MI450X in der Helios-Rack-Plattform soll mindestens 288 GB HBM4-Speicher pro GPU haben, könnte aber auch mehr erhalten – was Oracle im Rahmen eines maßgeschneiderten Designs ermöglicht. Da Oracle die Version mit der höchsten HBM-Kapazität bevorzugt, könnte der Cluster auf der MI450 basieren, auch wenn er in Helios-Racks integriert ist. Die Helios-Racks werden zudem mit zukünftigen AMD EPYC „Venice“-CPUs und Pensando „Vulcano“-DPUs ausgestattet sein. Diese DPUs dienen nicht nur als Netzwerkbeschleuniger, sondern fungieren auch als integrierte Switches im Acceleron-Netzwerkarchitektur-System von Oracle, das die Anzahl der Netzwerkschichten reduziert. Die Kommunikation zwischen den GPUs erfolgt über UALink over Ethernet (UALoE), eine Implementierung von Infinity Fabric über Ethernet, die möglicherweise mit Cisco- oder Marvell-ASICs oder direkt über Pensando-DPUs realisiert wird. Die geplante Kapazität von 700 Helios-Racks entspricht etwa 50.400 GPU-Sockeln und wird voraussichtlich zwischen 3,5 und 4 Milliarden US-Dollar kosten – inklusive Speicher und Netzwerk. Aufgrund der knappen Verfügbarkeit von HBM und GPU-Chips wird erwartet, dass Oracle keine Rabatte für die GPUs oder Hochleistungs-CPU- und DPU-Bestandteile erhält. Der Cluster wird Teil der allgemeinen OCI-Infrastruktur sein und nicht ausschließlich für Oracle-Partner wie OpenAI reserviert. Kunden können die Rechenleistung wie bereits bei der MI355X-Plattform nutzen, die Anfang 2025 allgemein verfügbar wurde. Die neue AI-Infrastruktur markiert einen bedeutenden Schritt in der Diversifizierung der AI-Hardware-Ökosysteme und unterstreicht Oracles strategische Positionierung im Wettbewerb um die dominante AI-Plattform. Mit der Kombination aus AMDs neuester GPU-Technologie, maßgeschneiderten Helios-Racks und einer eigenen Netzwerkarchitektur setzt Oracle auf eine hochskalierbare, flexibel nutzbare und unabhängig von Nvidia gestützte AI-Infrastruktur.
