La pénurie de mémoire menace l’essor de l’IA, selon le PDG de Google DeepMind
Le dirigeant de Google DeepMind, Demis Hassabis, a mis en garde contre une contrainte majeure dans le développement de l’intelligence artificielle : la pénurie de mémoire. Selon lui, le marché de la mémoire repose sur « quelques fournisseurs de quelques composants clés », ce qui crée un « point d’embouteillage » sérieux pour l’industrie. Cette situation touche même les géants technologiques comme Google, malgré leurs ressources considérables. Les entreprises spécialisées en IA s’affrontent pour accéder à des quantités croissantes de puces mémoire. Or, l’industrie est fortement contrainte en termes d’offre. Les coûts ont grimpé en flèche, les produits sont bloqués, et de nombreuses entreprises, notamment dans l’électronique grand public, sont obligées d’augmenter leurs prix. Hassabis a expliqué à CNBC que des difficultés matérielles freinent aujourd’hui « beaucoup de déploiements ». Google constate une demande bien supérieure à sa capacité de production pour ses modèles comme Gemini. « Cela limite aussi un peu la recherche », a-t-il ajouté. « Pour expérimenter de nouvelles idées à grande échelle, il faut beaucoup de puces, car seules des simulations massives permettent de savoir si une approche fonctionne. » Les chercheurs, qu’ils soient chez Google, Meta, OpenAI ou ailleurs, ont tous besoin de puces, et la mémoire est un élément essentiel. Mark Zuckerberg avait déjà souligné que les chercheurs en IA demandaient deux choses en plus de l’argent : le moins de personnes à encadrer possible, et le maximum de puces disponibles. Pour Hassabis, chaque limitation de capacité devient un « point d’embouteillage ». « La chaîne d’approvisionnement est globalement tendue », a-t-il noté. « Heureusement, nous avons nos propres TPUs, donc nous disposons de nos propres conceptions de puces. » Google fabrique depuis longtemps des unités de traitement tensoriel (TPU) pour ses besoins internes et les met également à disposition de clients externes via son cloud, une stratégie qui a mis Nvidia sous pression. Toutefois, même avec ses propres puces, Google ne peut échapper à la concurrence pour la mémoire. « En fin de compte, cela dépend toujours de quelques fournisseurs de quelques composants clés », a précisé Hassabis. Trois entreprises dominent la production de puces mémoire : Samsung, Micron et SK Hynix. Elles peinent à satisfaire la demande croissante des hyperscalers IA sans négliger leurs anciens clients du secteur électronique grand public. En outre, les besoins des entreprises d’IA diffèrent de ceux des fabricants de PC : les modèles de langage à grande échelle exigent surtout des puces HBM (mémoire à large bande passante), une technologie plus performante mais plus rare. Google n’a pas l’intention de réduire ses dépenses dans l’infrastructure IA. Lors de son appel aux résultats du quatrième trimestre, l’entreprise a annoncé des investissements en capital prévus entre 175 et 185 milliards de dollars pour 2026. Cette montée en puissance témoigne de la pression continue exercée par la demande croissante de mémoire et de puissance de calcul dans l’univers de l’intelligence artificielle.
