Meta erweitert Custom Silicon für KI-Workloads
Meta plant die massive Erweiterung seiner eigenen Siliziumproduktion, um die wachsenden Anforderungen künstlicher Intelligenz zu erfüllen. Das Unternehmen hat im Jahr 2023 die MTIA-Serie (Meta Training and Inference Accelerator) vorgestellt, die speziell für effiziente KI-Arbeitslasten entwickelt wurde. Nun kündigt Meta an, innerhalb der nächsten zwei Jahre vier weitere Generationen dieser Prozessoren zu entwickeln und einzusetzen. Dieses Tempo ist im Vergleich zu den üblichen Zyklen der Halbleiterindustrie außergewöhnlich schnell. Die Strategie von Meta basiert auf einem portfolioartigen Ansatz. Während das Unternehmen weiterhin Chips von verschiedenen Industrieherstellern bezieht, bleibt die eigene MTIA-Silikonproduktion das Herzstück der Infrastruktur. B部署tätigt Meta bereits Hunderttausende von MTIA-Chips für Inferenzaufgaben, sowohl für organische Inhalte als auch für Werbeanzeigen in seinen Apps. Diese Chips sind Teil einer vollständig angepassten Lösung, die eine höhere Rechenleistung und Kosteneffizienz bietet als allgemeine Standardchips für diese spezifischen Aufgaben. Der neue Entwicklungsweg umfasst vier spezifische Modelle. Die MTIA 300 wird bereits in der Produktion eingesetzt und ist für das Training von Ranking- und Empfehlungsalgorithmen optimiert. Die zukünftigen Modelle MTIA 400, 450 und 500 sind so konzipiert, dass sie alle Arbeitslasten bewältigen können. Ihr primärer Fokus liegt jedoch in naher Zukunft bis ins Jahr 2027 auf der Unterstützung von Generative-AI-Inferenzaufgaben. Dank der modularen Bauweise lassen sich diese neuen Chips einfach in bestehende Rechenzentrumsinfrastrukturen integrieren, was die Zeit bis zur Produktion verkürzt. Der Erfolg dieser Strategie stützt sich auf drei Hauptsäulen. Erstens ermöglicht der modulare Aufbau ein rasantes, iteratives Entwicklungsmodell. Während die Branche durchschnittlich alle ein bis zwei Jahre neue Chips vorstellt, kann Meta aufgrund wiederverwendbarer Designs alle sechs Monate oder kürzer neue Generationen liefern. Dies erlaubt eine schnelle Anpassung an neue KI-Technologien und hilft, Kosten zu senken. Zweitens folgt Meta einem klaren Fokus auf Inferenz statt Training. Während Mainstream-Chips oft für das aufwendige Pre-Training großer Modelle gebaut werden und für andere Aufgaben weniger kosteneffizient sind, wurden die MTIA 450 und 500 primär für den effizienten Inferenzbetrieb optimiert. Sie können später auch für andere Aufgaben wie Training oder Empfehlungssysteme genutzt werden, was sie ideal an das prognostizierte Wachstum von Inferenzaufgaben anpasst. Drittens basiert die Entwicklung von Anfang an auf Branchenstandards. Die Chips sind nahtlos in Ökosysteme wie PyTorch, vLLM, Triton und die Open Compute Project-Standards integriert. Dies gewährleistet eine reibungslose Software- und Hardwareanpassung und erleichtert den Einsatz in bestehenden Rechenzentren. Meta glaubt, dass kein einzelner Chip alle Anforderungen erfüllen kann. Durch den Einsatz eines diversifizierten Portfolios an spezialisierten Chips strebt das Unternehmen an, schneller zu innovieren und sein Ziel zu erreichen, eine persönliche Superintelligenz für alle zu schaffen. Weitere Details zur Roadmap werden auf dem Meta AI Blog veröffentlicht.
