HyperAIHyperAI
Back to Headlines

AMD présente l'Instinct MI355X : une avancée majeure en performance pour l'IA, mais avec une consommation énergétique de 1 400 watts

il y a 2 mois

AMD dévoile l'Instinct MI355X : une puissance d'inférence massive, mais une consommation d'énergie quasi doublée Au cours de la conférence International Supercomputing (ISC) 2025, Mark Papermaster, le Chief Technology Officer (CTO) d'AMD, a officiellement présenté les nouveaux accélérateurs Instinct MI355X, conçus pour l'intelligence artificielle (IA) et le calcul haute performance (HPC). Ces accélérateurs promettent des améliorations significatives en matière de performance d'inférence, malgré une consommation d'énergie presque doublée par rapport au modèle précédent sorti en 2023. Contexte Architectural Les Accélérateurs AMD Instinct MI350X sont basés sur l'architecture CDNA 4, qui introduit le support des formats de précision FP4 et FP6, en complément des formats FP8 et FP16. Ces formats de précision réduite ont pris une importance croissante dans les charges de travail liées à l'IA, notamment pour l'inférence. AMD positionne ses processeurs Instinct MI350X principalement pour l'inférence, une décision logique étant donné que la taille maximale du monde d'expansion (scale out) de ces GPU est limitée à huit unités, ce qui réduit leur compétitivité face aux GPU Blackwell d'Nvidia. Cependant, Pegatron est actuellement en cours de préparation d'une machine capable de déployer jusqu'à 128 MI350X. Modèles et Performances La famille Instinct MI350X d'AMD comprend deux modèles : 1. Instinct MI350X : consomme jusqu'à 1000W et est conçu pour être refroidi par air. Il offre jusqu'à 18.45 PFLOPS en précision FP4/FP6, ce qui est déjà un bond significatif par rapport à son prédécesseur, l'Instinct MI325X, qui culminait à 2.61 PFLOPS (ou 5.22 PFLOPS avec la structured sparsity). 2. Instinct MI355X : consomme jusqu'à 1400W et est principalement destiné au refroidissement liquide direct, bien que AMD estime que certains clients pourront l'utiliser avec un refroidissement par air. Ce modèle atteint jusqu'à 20.1 PFLOPS en précision FP4/FP6, surpassant légèrement la performance de 15 PF4 PFLOPS de l'Nvidia B300 (Blackwell Ultra). En termes de bande passante mémoire, les deux modèles sont dotés de 288 Go de HBM3E offrant jusqu'à 8 To/s, ce qui les place au sommet des technologies actuelles. Sur le plan de la performances, les données montrent que l'Instinct MI355X offre une performance de calcul en précision FP8 de 10.1 PFLOPS, contre 2.61/5.22 PFLOPS pour le MI325X (sans/avec la structured sparsity), ce qui représente une amélioration spectaculaire. L'Instinct MI355X domine également l'Nvidia B300 de 0.1 PF8 PFLOPS. Trajectoire du Développement des Supercalculateurs Papermaster a présenté des données indiquant que les supercalculateurs haut de gamme ont systématiquement suivi une trajectoire où la performance de calcul double environ tous les 1.2 ans depuis 1990. Au début, cette croissance était essentiellement pilotée par des systèmes basés uniquement sur des CPU, mais vers 2005, un changement vers des architectures hétérogènes (mélangeant CPU, GPU et accélérateurs) s'est opéré. Actuellement, dans ce que AMD appelle l'"Ère de l'IA Acceleration", des systèmes comme El Capitan et Frontier dépassent la barre des 1 ExaFLOP, poursuivant ainsi la tendance exponentielle de croissance des performances grâce à des matériels de plus en plus spécialisés en IA. Consommation Énergétique Croissante Malheureusement, cette augmentation des performances se fait au prix d'une consommation d'énergie croissante. Pour maintenir cette croissance, la bande passante mémoire et le scaling de la puissance sont devenus des défis urgents. Selon AMD, il faut que la bande passante mémoire des GPU double plus de deux fois tous les deux ans pour préserver le ratio bande passante par FLOPS. Cela implique d'augmenter le nombre de piles HBM par GPU, ce qui entraîne la création de GPU et de modules plus volumineux et énergivores. Par exemple, l'Instinct MI300X, introduit mi-2023, consommait jusqu'à 750W de puissance maximale. Le nouveau Instinct MI355X, présenté cette semaine, atteint jusqu'à 1400W. AMD anticipe des accélérateurs consommant 1600W en 2026-2027 et 2000W d'ici la fin de la décennie. En comparaison, Nvidia semble encore plus ambitieuse, avec des GPU Rubin Ultra de quadruple taille en puce (retile) prévu pour consommer jusqu'à 3600W. Effica Energetique Bien que la consommation d'énergie augmente rapidement, les supercalculateurs et les accélérateurs gagnent également en efficacité énergétique. Les données présentées par AMD montrent que l'efficacité énergétique a augmenté de 3.2 GFLOPS/W en 2010 à environ 52 GFLOPS/W pour les systèmes exascale actuels comme Frontier. Pour maintenir le rythme du scaling des performances, il faudra doubler l'efficacité énergétique tous les 2.2 ans. Un système zettascale prévu pour fournir 1000 fois la performance exaflopienne actuelle nécessiterait environ 500 MW de puissance à un niveau d'efficacité de 2140 GFLOPS/W (une augmentation de 41 fois par rapport à aujourd'hui). Sans ces gains d'efficacité, les futures supercalculateurs pourraient nécessiter une puissance d'un gigawatt, soit l'équivalent d'une centrale nucléaire entière, rendant leur exploitation extrêmement coûteuse. Vision de l'Avenir Pour augmenter considérablement la performance des supercalculateurs dans une dizaine d'années, AMD croit qu'il faut non seulement réaliser des avancées architecturales majeures, mais aussi que l'industrie doit accompagner le développement des capacités de calcul en fournissant une bande passante mémoire adéquate. L'utilisation de réacteurs nucléaires pour alimenter ces supercalculateurs semble de plus en plus réalisable dans les années 2030. Évaluation de l'Industrie L'introduction de l'Instinct MI355X marque une avancée significative pour AMD dans la course aux supercalculateurs de pointe. Malgré son importante consommation d'énergie, l'amélioration notable des performances d'inférence fait de ce GPU une option compétitive dans le domaine de l'IA. Toutefois, la gestion de la consommation énergétique reste un défi crucial, soulignant l'importance de l'efficacité énergétique pour les futures générations de systèmes HPC et IA. AMD continue de positionner ses produits au sommet de la technologie tout en mettant l'accent sur la recherche et le développement pour répondre aux besoins futurs de l'industrie. Profil de l'Entreprise Advanced Micro Devices (AMD) est une entreprise majeure dans le secteur des semi-conducteurs, connue pour ses processeurs et chipsets innovants. Avec ses technologies de pointe dans le domaine de l'IA et du HPC, AMD continue de jouer un rôle vital dans le développement de matériel informatique avancé, rivalisant activement avec des leaders comme Nvidia dans la course aux performances et à l'efficacité. L'annonce de l'Instinct MI355X souligne l'engagement de l'entreprise à pousser les frontières de la technologie tout en relevant les défis énergétiques.

Related Links

AMD présente l'Instinct MI355X : une avancée majeure en performance pour l'IA, mais avec une consommation énergétique de 1 400 watts | Gros titres | HyperAI