Google stellt zwei neue TPU-Chips vor
Google hat auf der Cloud Next Konferenz seine achte Generation an Tensor Processing Units (TPUs) vorgestellt. Das Unternehmen führt zwei neu entwickelte Chipspezifikationen ein: den TPU 8t für das Training von Modellen und den TPU 8i für die Inferenz. Beide Varianten wurden in Zusammenarbeit mit Google DeepMind entwickelt, um die wachsenden Anforderungen an künstliche Intelligenz und autonome Agenten zu erfüllen. Diese Hardware ist entscheidend für den Aufbau der sogenannten Supercomputer, die für die Entwicklung fortschrittlicher Modelle und komplexe Aufgabenstellungen benötigt werden. Die Einführung dieser Chips erfolgt in einer Zeit, in der KI-Agenten nicht nur Daten verarbeiten, sondern selbstständig Probleme lösen, Arbeitsabläufe ausführen und durch kontinuierliche Schleifen dazulernen. Um diese neuen Anforderungen zu bewältigen, haben sich die Entwickler für eine spezialisierte Architektur entschieden. Während der TPU 8t auf maximale Rechenleistung und Durchsatz für rechenintensive Trainingsaufgaben ausgelegt ist, bietet der TPU 8i einen größeren Arbeitsspeicher-Bandbreitenbereich, um latenzkritische Inferenz-Anwendungen zu optimieren. Obwohl beide Chips prinzipiell verschiedene Aufgaben übernehmen können, ermöglicht diese Spezialisierung erhebliche Effizienzsteigerungen. Der TPU 8t ist darauf ausgelegt, die Entwicklungszyklen für fortschrittliche Modelle von Monaten auf wenige Wochen zu verkürzen. Er liefert eine fast dreifache Rechenleistung pro Cluster im Vergleich zur Vorgängergeneration. Besonders hervorzuheben ist die Zuverlässigkeit: Das System wurde so konstruiert, dass über 97 Prozent der Rechenzeit für nützliche Aufgaben genutzt werden können. Durch moderne Überwachungssysteme werden Fehler in der Hardware oder im Netzwerk automatisch erkannt und umgangen, ohne den laufenden Prozess zu unterbrechen. Beide Chips laufen erstmals auf dem eigenen AXION-Prozessor von Google basierend auf der ARM-Architektur. Diese Integration erlaubt eine optimierte Abstimmung von Prozessor und Beschleuniger, was die Gesamteffizienz des Systems steigert. Die neue Hardware unterstützt etablierte Frameworks wie JAX, PyTorch und vLLM und bietet Entwicklern direkten Zugang zur Hardware ohne Virtualisierungsschichten. Ein weiterer Schwerpunkt liegt auf der Energieeffizienz. Angesichts der begrenzten Stromverfügbarkeit in Rechenzentren bietet die achte Generation bis zu doppelt so viel Leistung pro Watt wie die vorherige Ironwood-Generation. Google hat durch die Kombination von Netzwerkkomponenten mit den Chips und den Einsatz fortschrittlicher Flüssigkeitskühlungstechnologien erreicht, dass die Rechenleistung pro verbrauchter Kilowattstunde im Vergleich zu vor fünf Jahren sechsmal gestiegen ist. Die neuen TPUs werden später im Jahr allgemein verfügbar sein und als Teil des Google AI Hypercomputers eingesetzt werden. Diese Plattform vereint speziell entwickelte Hardware, offene Softwarelösungen und flexible Bereitstellungsmodelle zu einer einheitlichen Infrastruktur. Mit diesem Schritt positioniert sich Google, um die Anforderungen der nächsten Generation von KI-Agenten zu meistern und Innovationen in Bereichen wie autonomes Planen und komplexes Schlussfolgern voranzutreiben. Unternehmen wie die Citadel Securities nutzen bereits die bisherigen Generationen, um ihre KI-Workloads zu beschleunigen, und werden von den neuen Möglichkeiten profitieren.
