Google Cloud lance deux puces IA pour concurrencer Nvidia
Google Cloud a officiellement présenté, ce mercredi, sa huitième génération de puces sur mesure destinées à l'intelligence artificielle, les Tensor Processing Units ou TPU. Cette nouvelle ligne de produits se divise en deux modèles distincts : la TPU 8t, conçue spécifiquement pour l'entraînement des modèles, et la TPU 8i, optimisée pour l'inférence, qui correspond à l'utilisation opérationnelle des modèles par les utilisateurs après la soumission de leurs requêtes. Les spécifications techniques annoncées par l'entreprise sont particulièrement ambitieuses par rapport aux générations précédentes. Google revendique une vitesse d'entraînement des modèles multipliée par trois, une amélioration de 80 % du rapport performance par dollar et la capacité de faire coopérer plus d'un million de TPU au sein d'un seul cluster. L'objectif déclaré est d'offrir aux clients une puissance de calcul bien supérieure tout en réduisant significativement la consommation énergétique et les coûts d'exploitation. Cependant, cette percée ne marque pas une offensive frontale destinée à éliminer son principal concurrent, Nvidia. À l'instar de ses rivaux du secteur du cloud comme Microsoft et Amazon, Google utilise ces puces pour compléter, et non pour remplacer, les infrastructures basées sur les processeurs graphiques de Nvidia qu'il propose déjà. L'entreprise a d'ailleurs confirmé que le tout nouveau puce de Nvidia, nommée Vera Rubin, sera disponible dans son cloud d'ici la fin de l'année. La dynamique du marché suggère que si les géants du cloud continuent de développer leurs propres puces pour s'affranchir progressivement de la dépendance envers Nvidia, le moment n'est pas encore venu pour parier contre ce dernier. Le marché de Nvidia, évalué à près de 5 000 milliards de dollars, illustre la solidité de sa domination. Une prédiction ironique formulée par l'analyste Patrick Moorhead en 2016, qui voyait les premières TPU de Google comme une menace pour Nvidia, n'a pas trouvé de confirmation dans la réalité des faits. Au contraire, la croissance de Google Cloud pourrait bénéficier à Nvidia en augmentant le volume global d'équipements nécessaires pour soutenir l'expansion de l'intelligence artificielle. Au-delà de la compétition, une coopération significative se dessine entre les deux géants technologiques. Google et Nvidia collaborent activement pour concevoir des réseaux informatiques permettant aux systèmes basés sur la technologie de Nvidia de fonctionner encore plus efficacement au sein de l'infrastructure Google. Cette alliance s'appuie notamment sur une technologie de réseau logicielle appelée Falcon, développée et rendue open source par Google en 2023 au sein de l'Open Compute Project, un organisme de référence dans le domaine du matériel de centre de données. Cette stratégie mixte, combinant innovation interne et synergies partenaires, positionne Google Cloud pour répondre à la demande croissante en puissance de calcul sans renoncer aux avantages de l'écosystème Nvidia.
