HyperAIHyperAI

Command Palette

Search for a command to run...

il y a un mois
Google
Agent
GPU

Google lance deux nouvelles puces TPUs de 8e génération

Google a présenté lors de l'événement Google Cloud Next sa huitième génération de processeurs Tensor Processing Unit (TPU), conçue pour l'ère des agents intelligents. Cette nouvelle génération se décline en deux architectures distinctes spécialisées : la TPU 8t pour l'entraînement des modèles et la TPU 8i pour les tâches d'inférence. Ces puces, développées en collaboration avec Google DeepMind, visent à alimenter les supercalculateurs personnalisés de l'entreprise pour gérer des charges de travail massives allant du développement de modèles de base comme Gemini à l'exécution de workflows complexes par des agents autonomes. La conception de ces composants répond à l'évolution rapide des besoins en infrastructure pour l'intelligence artificielle. Alors que les agents nécessitent désormais des boucles continues de raisonnement, de planification et d'apprentissage, l'infrastructure doit s'adapter pour éviter les goulots d'étranglement. La TPU 8t est optimisée pour l'entraînement, offrant un débit de calcul et une bande passante d'interconnexion élevés, ce qui permet de réduire le cycle de développement des modèles frontières de mois à semaines. Elle offre environ trois fois plus de performances de calcul par cluster que la génération précédente, tout en maintenant un taux de productivité supérieur à 97 % grâce à des systèmes avancés de détection des pannes et de reconfiguration automatique des réseaux. De son côté, la TPU 8i est conçue pour une bande passante mémoire élevée, ce qui est crucial pour l'inférence sensible à la latence. Dans les systèmes à grande échelle impliquant des agents, même de petites inefficacités peuvent être amplifiées, rendant cette spécialisation essentielle. Bien que les deux puces puissent exécuter divers types de charges de travail, leur spécialisation permet d'obtenir des gains d'efficacité significatifs. Pour la première fois, ces puces fonctionnent avec le processeur Axion basé sur l'architecture ARM de Google, permettant une optimisation globale du système plutôt que celle d'un composant isolé. Elles prennent en charge nativement les frameworks de développement courants tels que JAX, PyTorch, MaxText et vLLM, et offrent un accès bare metal, éliminant la surcharge de la virtualisation. Cette approche de co-conception s'étend également à la gestion de l'énergie. Face à la contrainte croissante de la puissance électrique dans les centres de données, la nouvelle génération de TPU offre jusqu'à deux fois plus de performances par watt que la précédente génération Ironwood. Grâce à une technologie de refroidissement liquide de quatrième génération et à l'intégration réseau-directe sur puce, Google vise à maximiser la densité de calcul par unité d'énergie consommée. Ces deux puces seront disponibles pour tous les clients plus tard cette année dans le cadre de l'IA Hypercomputer de Google, une plateforme unifiant matériel, logiciels open source et modèles de consommation flexibles. Déjà, des organisations pionnières comme Citadel Securities ont choisi d'utiliser les TPU pour leurs charges de travail avancées. La disponibilité de la TPU 8t et de la TPU 8i marque une étape clé dans l'évolution des infrastructures nécessaires pour soutenir la croissance des agents autonomes et la complexité croissante des tâches de raisonnement en intelligence artificielle. Les clients intéressés peuvent déjà solliciter des informations supplémentaires pour préparer leurs déploiements futurs.

Liens associés

Google lance deux nouvelles puces TPUs de 8e génération | Articles tendance | HyperAI