AMD: Zettascale-Supercomputer brauchen halbes Gigawatt
AMD spricht bei ISC 2025 über die Herausforderungen der Entwicklung von AI-Beschleunigern und insbesondere über die steigenden Energieanforderungen dieser hochentwickelten Chips. Laut ComputerBase erwartet AMD, dass zukünftige Supercomputer mit ZettaFLOP-Leistung den Energieverbrauch einer Kernkraftwerksanlage benötigen werden. AMD präsentierte einen Graphen, der den prognostizierten Wachstum des Supercomputerverbrauchs bis 2035 zeigt. Der Graph beginnt zwischen 2010 und 2015, als Supercomputer noch 3,2 Gigaflops pro Watt verbraucht haben. Er erstreckt sich in gerader Linie bis 2035, wenn AMD voraussagt, dass ZettaFLOP-fähige Supercomputer 2140 Gigaflops pro Watt oder halb einen Gigawatt verbrauchen werden. Dies entspricht dem Energiebedarf von etwa 375.000 Haushalten. Die Hauptfaktoren, die für diesen steigenden Energieverbrauch verantwortlich sind, sind der Speicherbandbreite und die Kühlleistung. Mit der zunehmenden Rechenleistung von KI-Hardware müssen auch die Speicherbandbreite und die Kühlleistung in Rechenzentren erhöht werden, was eine Art Schneeballsystem von ständig steigendem Energieverbrauch in allen Bereichen eines Rechenzentrums schafft. Diese Problematik wird durch die Nachfrage nach FP128, FP64, FP16 und FP8-Berechnungsfähigkeiten weiter verstärkt. Obwohl FP64 und FP128 eine bessere Genauigkeit bieten, sind manche Workloads bei der Verwendung von FP16 und FP8 nützlicher. Daher müssen zukünftige KI-Beschleuniger sowohl niedrigere als auch höhere Präzisionsoperationen durchführen können. Der Energieverbrauch steigt bereits dramatisch mit den neuesten KI-Beschleunigern. Nvidias B200 hat eine thermische Designleistung (TDP) von 1000 Watt, und der brandneue AMD MI355X erreicht sogar 1400 Watt. Im Vergleich dazu verbrauchte Nvidias A100, das Flaggschiff-AI-GPU aus vor fünf Jahren, nur 400 Watt — weniger als ein RTX 5090. Die US-Regierung bemüht sich, diese wachsende Energiekrise zu lösen, indem sie auf Kernkraftwerke setzt. Große Unternehmen wie Microsoft investieren ebenfalls massiv in Kernfusion, um ihre Energieprobleme in Rechenzentren zu bewältigen. Derzeit befinden sich Supercomputer noch im ExaFLOP-Bereich, wobei der ElCaptain, der auf der AMD MI300A basiert, der schnellste Supercomputer der Welt ist. Allerdings erreichen voll ausgestattete KI-Rechenzentren bereits ZettaFLOP-Leistung. Oracle war das erste Unternehmen, das einen ZettaFLOP-Wolkencomputing-Cluster anbot, bestehend aus 131.072 Blackwell-GPUs, die zusammen eine Leistung von 2,4 ZettaFLOPS erzielen. Industrielle Insider betonen die Notwendigkeit, innovative Lösungen zu entwickeln, um den Energieverbrauch zukünftiger Supercomputer und KI-Rechenzentren zu reduzieren. Die Investitionen in Kernfusion und andere fortschrittliche Energietechnologien gelten als entscheidend, um den Bedarf an Energie zu decken und gleichzeitig die Umweltbelastung zu minimieren. AMD und Nvidia sind dabei, erhebliche Fortschritte bei der Effizienzverbesserung ihrer Hardware zu machen, aber es bleibt abzuwarten, ob dies ausreicht, um die prognostizierten Energiebedarfe zu bewältigen. AMD ist ein führender Hersteller von Prozessoren und Grafikkarten und hat sich in den letzten Jahren besonders auf die Entwicklung von High-Performance-Computing-Lösungen konzentriert. Die Firma steht in direktem Wettbewerb mit Nvidia und Intel, und ihre neuesten Produkte zeigen, dass sie bereit sind, den Energieeffizienzansprüchen der Zukunft zu genügen. Dennoch bleibt die Frage, ob die technologischen Fortschritte schneller voranschreiten als der steigende Energieverbrauch.