HyperAIHyperAI
Back to Headlines

Google setzt auf Flüssigkühlung für TPUs in Rechenzentren

vor 3 Tagen

Google präsentiert auf dem Hot Chips 2025 eine ausführliche Darstellung ihrer fortschrittlichen Flüssigkühlungslösung für Datenzentren, speziell für ihre Tensor Processing Units (TPUs), die für künstliche Intelligenz-Anwendungen entwickelt wurden. Die steigende Leistungsaufnahme moderner Chips, insbesondere bei KI-Workloads, führt zu erheblichen thermischen Herausforderungen. Google betont, dass Wasser eine Wärmeleitfähigkeit von etwa 4000-mal höherer Luft besitzt – eine entscheidende Vorteil für effiziente Kühlung. Seit 2018 entwickelt das Unternehmen kontinuierlich seine Flüssigkühlarchitektur weiter. Die aktuelle Lösung basiert auf rackübergreifenden Kühlkreisläufen, die über sogenannte Coolant Distribution Units (CDUs) gesteuert werden. Sechs CDUs pro Rack übernehmen die Funktion von Radiatoren und Pumpen in einem PC-Wasserkühlsystem, wobei flexible Schläuche und Schnellkupplungen die Wartung erleichtern und Toleranzen verringern. Ein redundanter CDU ermöglicht Wartung ohne Ausfallzeit, da fünf Einheiten ausreichen, um die Kühlleistung aufrechtzuerhalten. Die CDUs übertragen Wärme zwischen der internen Kühlflüssigkeit und der zentralen Anlagenwasserzufuhr, ohne dass sich die Flüssigkeiten vermischen. Die Kühlflüssigkeit wird über Verteiler (Manifolds) zu den TPU-Servern geleitet, wobei die Chips in Serie geschaltet sind – dadurch erhöht sich die Temperatur der Flüssigkeit mit jedem Chip. Die Kühlleistung wird daher nach dem letzten Chip im Kreis bemessen. Um die Effizienz zu steigern, verwendet Google einen sogenannten Split-Flow-Kühlkörper, der sich als überlegen gegenüber klassischen Durchflusskonfigurationen erwiesen hat. Zudem hat Google bei der TPUv4 auf eine „Bare-Die“-Architektur umgestellt – im Gegensatz zur abgedeckten TPUv3 – was der Delidding-Praxis in der PC-Enthusiasten-Szene entspricht. Dies ermöglicht eine bessere Wärmeabfuhr, notwendig, da die TPUv4 1,6-mal mehr Leistung verbraucht. Die Flüssigkühlung senkt zudem den Energieverbrauch für die Kühlung selbst: Pumpenverbrauch liegt bei weniger als 5 % des Stromverbrauchs von Lüftern in luftgekühlten Systemen. Da Google eine wasser-zu-wasser-Wärmeübertragung nutzt, entfällt der Energieaufwand für Luftkühlung. Im Gegensatz zu PC-Systemen, wo die Kühlleistung durch Lüfter am Gehäuse begrenzt ist, profitiert Google von der hohen Effizienz des Wassers, was die Gesamtleistungskosten senkt. Auch Wartung ist ein zentraler Punkt: Google setzt auf umfassende Validierung, Leckage-Tests, Frühwarnsysteme, Filterung und regelmäßige Wartung, unterstützt durch standardisierte Prozesse für eine schnelle Reaktion. Diese Maßnahmen unterscheiden sich deutlich von den ad-hoc-Methoden, die Enthusiasten anwenden. Die Entwicklung zeigt, dass Flüssigkühlung nicht mehr nur eine Nische für High-End-PCs ist, sondern eine zentrale Technologie für zukünftige Datenzentren. Auch andere Unternehmen wie Nvidia und Rebellions AI zeigen auf Hot Chips 2025 bereits flüssiggekühlte Systeme – von externen Anschlüssen bis zu komplexen Chiller-Setups. Die Kombination aus Effizienz, Skalierbarkeit und Zuverlässigkeit macht Flüssigkühlung zu einer unverzichtbaren Lösung im Zeitalter der KI. Die Branche steht vor einer tiefgreifenden Transformation, bei der Datenzentren zunehmend auf wasserbasierte Kühlkonzepte setzen – ein Trend, der sich auch in der kommenden Generation von Acceleratoren und Serverarchitekturen fortsetzen wird.

Related Links

Google setzt auf Flüssigkühlung für TPUs in Rechenzentren | Schlagzeilen | HyperAI