HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 3 mois
Meta
IA Générative

Meta élargit son silicium personnalisé pour l'IA

En 2023, Meta a introduit sa gamme de puces personnalisées Meta Training and Inference Accelerator (MTIA) pour optimiser ses charges de travail d'intelligence artificielle. Aujourd'hui, l'entreprise accélère considérablement son rythme d'innovation en développant et déployant quatre nouvelles générations de ces processeurs sur les deux prochaines années. Cette cadence, nettement plus rapide que les cycles traditionnels de l'industrie, vise à soutenir le classement, les recommandations et les charges de travail de l'intelligence artificielle générative. Alors que ses besoins en IA continuent d'évoluer, Meta adopte une approche de portefeuille en combinant des puces de différents leaders de l'industrie tout en plaçant la puce MTIA au cœur de sa stratégie d'infrastructure. Meta déploie actuellement des centaines de milliers de puces MTIA pour les tâches d'inférence sur ses applications, qu'il s'agisse de contenu organique ou de publicité. Ces composants sont spécifiquement conçus pour répondre aux besoins propres de la plateforme, constituant une solution intégrée qui optimise les performances et réduit les coûts par rapport aux puces à usage général. L'objectif est d'atteindre une efficacité informatique supérieure pour les tâches ciblées. La feuille de route de MTIA s'étend avec quatre nouvelles versions : la MTIA 300, déjà en production pour l'entraînement du classement et des recommandations, suivie des modèles 400, 450 et 500. Ces dernières sont conçues pour gérer l'ensemble des charges de travail, mais seront principalement déployées pour l'inférence de l'IA générative d'ici 2027. Leur conception modulaire permet une intégration directe dans les infrastructures existantes, accélérant ainsi leur mise en production. La stratégie de Meta se distingue par trois piliers fondamentaux. Premièrement, le développement rapide et itératif permet de lancer une nouvelle génération de puce tous les six mois ou moins, contre un ou deux ans pour l'industrie. Cette agilité favorise une adaptation rapide aux nouvelles techniques d'IA et réduit les coûts de développement. Deuxièmement, l'entreprise privilégie une approche centrée sur l'inférence. Contrairement aux puces grand public conçues pour l'entraînement à grande échelle avant d'être utilisées pour l'inférence, souvent de manière moins efficace, les puces MTIA 450 et 500 sont d'abord optimisées pour l'inférence de l'IA générative. Elles peuvent ensuite être réutilisées pour d'autres tâches, garantissant une meilleure réponse à la croissance anticipée de la demande d'inférence. Enfin, la compatibilité avec les normes de l'industrie est une priorité. MTIA intègre dès le départ des écosystèmes logiciels et matériels standards tels que PyTorch, vLLM, Triton et le projet Open Compute (OCP). Cette conformité facilite l'adoption sans friction et assure que les solutions système et les baies de serveurs sont parfaitement compatibles avec les standards des centres de données. Meta reconnaît qu'aucune puce unique ne peut satisfaire tous ses besoins variés. C'est pourquoi elle mise sur un portefeuille diversifié de solutions optimisées pour chaque type de charge de travail. Cette approche permet à l'entreprise d'innover à un rythme inégalé et de se rapprocher de son objectif à long terme : rendre l'intelligence artificielle personnelle accessible à tous.

Liens associés

Meta élargit son silicium personnalisé pour l'IA | Articles tendance | HyperAI