OpenAI et Broadcom dévoilent Jalapeño, puce dédiée aux LLM
OpenAI et Broadcom ont annoncé conjointement aujourd'hui le lancement de leur premier processeur intelligent conçu en interne, « Jalapeño ». Il s’agit d’une puce d’accélération IA conçue à partir de zéro pour les scénarios d’inférence des grands modèles linguistiques (LLM) à grande échelle, constituant la première pierre angulaire de la stratégie commune aux deux entreprises en matière de plateformes informatiques sur plusieurs générations. Le PDG d’OpenAI, Sam Altman, et son président exécutif Greg Brockman ont reçu un échantillon fonctionnel des mains du PDG de Broadcom, Hock Tan. La puce a démontré sa capacité à faire fonctionner avec succès dans l’environnement de laboratoire des charges de travail ML atteignant leurs fréquences cibles et leur consommation énergétique spécifiées pour la production, notamment GPT-5.3-Codex-Spark. En seulement neuf mois entre la conception et la fabrication par voie optique (« tape-out »), OpenAI qualifie ce délai de « cycle de développement ASIC le plus rapide jamais enregistré dans le domaine des semi-conducteurs avancés haute performance ». Derrière cette accélération, OpenAI ne repose pas uniquement sur les capacités de conception et de fabrication de Broadcom ; elle a également intégré ses propres modèles afin d’optimiser le processus de conception de la puce : un même modèle sert simultanément les utilisateurs finaux et contribue à améliorer les matériels de nouvelle génération qui l’exécuteront. Les premiers tests indiquent que les performances par watt de Jalapeño surpassent nettement les solutions actuelles les plus performantes. Son architecture vise à réduire au minimum les transferts de données tout en répartissant équitablement les ressources dédiées au calcul, à la mémoire et au réseau, permettant ainsi une utilisation effective se rapprochant davantage du pic théorique. Un rapport technique détaillé présentant ces performances sera publié dans quelques mois. Loin d’être une simple amélioration d’un accélérateur universel, Jalapeño est conçu spécifiquement dès l’origine pour l’inférence LLM, en s’appuyant sur les connaissances systémiques acquises par OpenAI grâce à ChatGPT, Codex, son API et ses futurs produits basés sur des agents. L’objectif affiché consiste à trouver un équilibre optimal entre la puissance de traitement maximale offerte par les meilleurs accélérateurs IA et la faible latence requise par les systèmes d’inférence les plus rapides, répondant ainsi parfaitement aux besoins des produits interactifs LLM déployés à très large échelle. La feuille de route de déploiement est désormais clairement définie : à compter de la fin 2026, des centres de données capables de fournir des gigawatts seront construits en collaboration avec Microsoft et d’autres partenaires, puis étendus progressivement année après année. Le support technologique nécessaire à la mise en série de cette plateforme reposera sur les puces réseau Tomahawk de Broadcom ainsi que sur les compétences de Celestica en intégration système et assemblage de cartes électroniques. « Le monde évolue vers une économie pilotée par la puissance informatique », déclare Brockman. « Jalapeño fait partie de notre stratégie globale à long terme en matière d'infrastructures complètes – concevoir davantage de couches matérielles propriétaires afin de servir davantage d'intelligence avec plus d'efficacité, rendant ainsi l'IA accessible à un public toujours plus vaste. »
