HyperAIHyperAI

Command Palette

Search for a command to run...

AWS lance les Trainium3 UltraServers : une puissance de calcul AI révolutionnaire à moindre coût

Amazon Web Services (AWS) annonce aujourd’hui la disponibilité générale des serveurs UltraServers Trainium3, équipés de la première puce IA à 3 nm conçue par AWS. Cette annonce, faite lors du congrès re:Invent à Las Vegas, marque une avancée majeure dans la performance et l’efficacité des charges de travail d’entraînement et d’inférence d’intelligence artificielle. Les serveurs UltraServers Trn3 offrent une performance de calcul jusqu’à 4,4 fois supérieure, une efficacité énergétique quadruplée et une bande passante mémoire presque quadruplée par rapport aux serveurs UltraServers Trainium2. Ces améliorations permettent aux organisations de toutes tailles de développer leurs modèles d’IA plus rapidement, tout en réduisant leurs coûts opérationnels. Grâce à une capacité de mise à l’échelle pouvant atteindre 144 puces Trainium3, ces serveurs atteignent jusqu’à 362 PFLOPs en précision FP8, avec une latence réduite de 4 fois. Cette puissance accrue permet de former des modèles plus volumineux plus rapidement et de déployer des inférences à grande échelle, essentielles pour les applications en temps réel comme la génération de vidéos ou les systèmes de recommandation avancés. Plusieurs clients ont déjà adopté cette technologie avec des résultats significatifs. Anthropic, Karakuri, Metagenomi, NetoAI, Ricoh et Splash Music ont réduit leurs coûts d’entraînement et d’inférence jusqu’à 50 % grâce à Trainium. Décart, quant à lui, a obtenu une accélération de 4 fois dans ses inférences pour la vidéo générative en temps réel, tout en réduisant ses coûts de moitié par rapport aux GPU traditionnels. Amazon Bedrock, la plateforme d’IA générative d’AWS, utilise déjà les Trainium3 pour exécuter des charges de travail en production. Forte de sa vision centrée sur le client, l’innovation rapide, l’excellence opérationnelle et une approche à long terme, AWS continue de démocratiser l’accès à la technologie, en particulier dans le domaine de l’intelligence artificielle générative. Grâce à une infrastructure mondiale et une gamme complète de services d’IA, AWS permet aux développeurs et aux entreprises de transformer leurs idées ambitieuses en réalités concrètes. Pour en savoir plus sur les serveurs UltraServers Trainium3, rendez-vous sur aws.amazon.com.

Liens associés