AMD präsentiert neue Instinct MI355X-GPU mit 1400W Verbrauch
AMD präsentierte bei ISC 2025 die neuen Instinct MI355X-Acceleratoren für künstliche Intelligenz (AI) und High-Performance Computing (HPC). Der Chief Technology Officer von AMD, Mark Papermaster, enthüllte erhebliche Leistungsverbesserungen bei diesen Prozessoren, insbesondere für AI-Inferenz, aber auch deutlich erhöhte Energieverbrauchswerte im Vergleich zu den Vorgängern aus dem Jahr 2023. Die Instinct MI350X-Reihe basiert auf der CDNA 4-Architektur, die Unterstützung für niedrigere Genauigkeitsformate wie FP4, FP6, FP8 und FP16 bietet. Diese Formate sind besonders relevant für AI-Workloads, insbesondere für Inferenz. AMD positioniert die Instinct MI350X-Prozessoren hauptsächlich für Inferenz, da ihre Skalierung auf maximal acht GPUs begrenzt ist. Dies reduziert ihre Wettbewerbsfähigkeit gegenüber Nvidias Blackwell-GPUs. Dennoch bereitet Pegatron eine 128-Weg-MI350X-Maschine vor. Die Instinct MI350X-Familie umfasst zwei Modelle: das Standardmodul Instinct MI350X mit einem Energieverbrauch von 1000 Watt, das für Luftkühlung ausgelegt ist, und das leistungsstärkere Instinct MI355X, das bis zu 1400 Watt verbraucht und hauptsächlich für Direktschwimmkühlung konzipiert ist. Beide Modelle verfügen über 288 GB HBM3E-Speicher, der eine Bandbreite von bis zu 8 TB/s bieten kann. Das Instinct MI355X erreicht dabei eine maximale FP4/FP6-Leistung von 20,1 PFLOPS, während das Instinct MI350X bei 18,45 PFLOPS liegt. Hierbei übertreffen beide Modelle Nvidias B300 (Blackwell Ultra)-GPU, die eine maximale FP4-Leistung von 15 PFLOPS erreicht. Im Vergleich zu seinen Vorgängern zeichnet sich die MI350X-Reihe durch einen erheblichen Leistungsanstieg aus. Die FP8-Berechnungsdurchsatzrate der MI350X beträgt etwa 9,3 PFLOPS, während die schnellere MI355X-Version bei 10,1 PFLOPS liegt. Dies stellt einen signifikanten Verbesserungsschritt dar, da die Instinct MI325X aus dem Jahr 2023 bei 2,61/5,22 PF8-FLOPS (ohne/mit strukturierten Sparsity) lag. Gleichzeitig übertreffen die MI355X-Modelle auch die B300 von Nvidia um 0,1 PF8-PFLOPS. Papermaster betonte, dass die Branche weiterhin leistungsfähigere CPUs und Acceleratoren für Supercomputer entwickeln wird, um in etwa einem Jahrzehnt Zettaflop-Leistungen zu erreichen. Allerdings wird dies mit einem steilen Anstieg des Energieverbrauchs einhergehen. Ein Zettaflop-Supercomputer könnte dann 500 MW Energie verbrauchen, das entspricht etwa der Hälfte der Leistung eines Kernkraftwerks. Bei ISC 2025 zeigte AMD, dass Top-Supercomputer seit 1990 eine Leistungsentwicklung verfolgt haben, bei der die Rechenleistung alle 1,2 Jahre verdoppelt wurde. Dieses Wachstum wurde initially durch CPU-basierte Systeme getrieben, ab 2005 aber durch heterogene Architekturen, die CPUs mit GPUs und Acceleratoren kombinieren. In der sogenannten "AI-Acceleration-Ära" treiben Systeme wie El Capitan und Frontier die Leistung über 1 Exaflop, fortgesetzt von immer spezialisierteren AI-Hardware. Ein wesentlicher Aspekt dieser Entwicklung ist der Energieverbrauch. Während der Instinct MI300X, der Mitte 2023 eingeführt wurde, einen Spitzenverbrauch von 750 Watt hatte, wird der neue Instinct MI355X einen Spitzenverbrauch von 1400 Watt aufweisen. Papermaster prognostiziert, dass 2026-2027 Acceleratoren mit 1600 Watt und später in diesem Jahrzehnt Prozessoren mit 2000 Watt erscheinen werden. Im Gegensatz dazu scheinen Nvidias Rubin Ultra-GPUs, die vier retikelförmige Rechenelemente aufweisen, sogar noch ehrgeizigere Ziele zu verfolgen, da sie einen Verbrauch von bis zu 3600 Watt erreichen sollen. Die gute Nachricht ist, dass Supercomputer und Acceleratoren auch rapid in ihrer Energieeffizienz Fortschritte machen. Ein Diagramm von AMD verdeutlicht, dass die Energieeffizienz von etwa 3,2 GFLOPS/W im Jahr 2010 auf etwa 52 GFLOPS/W gestiegen ist, als exaskalige Systeme wie Frontier erschienen. Um diese Leistungsentwicklung aufrechtzuerhalten, muss die Energieeffizienz alle 2,2 Jahre verdoppelt werden. Ein zukünftiges Zettaflops-System, das 1000-fache Exaflop-Leistung liefert, würde bei einer Effizienz von 2140 GFLOPS/W (eine 41-fache Steigerung im Vergleich zum aktuellen Stand) etwa 500 MW Energie benötigen. Ohne solche Fortschritte könnten zukünftige Supercomputer Energiemengen im Gigawatt-Bereich verlangen, was den Betrieb dieser Systeme extrem teuer machen würde. AMD glaubt, dass erhebliche architektonische Neuerungen erforderlich sind, um die Leistung von Supercomputern um das Jahr 2030 drastisch zu steigern. Zugleich muss die Branche Schritt halten, um ausreichende Speicherbandbreite zu gewährleisten. Die Nutzung von Kernreaktoren zur Versorgung von Supercomputern erscheint in den 2030er Jahren zunehmend realistisch. Industrie-Experten bewerten die neuen AMD-Instinct-MI355X-Acceleratoren als signifikanten Fortschritt in der Entwicklung von AI- und HPC-Technologien. Sie erkennen jedoch auch die Herausforderungen, die mit dem steigenden Energieverbrauch verbunden sind. AMD hat sich in der Vergangenheit durch innovative Lösungen hervorgetan und ist bestrebt, auch in Zukunft an der Spitze der Technologieentwicklung zu bleiben. Die Firma arbeitet eng mit Partnern zusammen, um die notwendige Infrastruktur für die kommenden Generationen von Supercomputern bereitzustellen.