HyperAIHyperAI

Command Palette

Search for a command to run...

Nvidia rachète Groq et Enfabrica : une stratégie secrète pour réinventer l’inference IA ?

Nvidia est-elle en train de rassembler les éléments de sa prochaine plateforme d’inférence ? Bien que nous ayons noté l’acquihire de Groq, concurrent spécialisé dans les accélérateurs d’IA et opérateur de cloud, effectué par Nvidia à l’occasion de Noël, nous avons tardé à analyser les implications de ce rachat de 20 milliards de dollars. Ce n’est qu’après avoir manqué un autre acquihire plus discret, celui d’Enfabrica en septembre 2025 pour environ 900 millions de dollars, que nous avons compris que ces deux opérations s’inscrivent dans une stratégie plus vaste. Elles pourraient mener à une révolution architecturale dans les accélérateurs d’IA, au point que les futurs produits de Nvidia ne seront plus simplement des GPU, mais des systèmes intégrés aux architectures radicalement nouvelles. Groq, fondée en 2015, avait émergé comme l’un des rares acteurs capables de rivaliser avec Nvidia sur l’inférence d’IA, grâce à son Learning Processing Unit (LPU) et à son compilateur optimisé. Son dernier tour de financement, de 750 millions de dollars en septembre 2025, avait porté sa valorisation à 6,9 milliards. Malgré un engagement de 1,5 milliard de dollars de l’Arabie saoudite pour un centre de données GroqCloud à Dammam, ce projet n’a pas vu le jour. La vente à Nvidia, qui a acquis les brevets clés et recruté la majorité de l’équipe technique — notamment Jonathan Ross, co-fondateur, et Sunny Madra, COO — semble être un exit stratégique opportun. Pour les investisseurs, un retour de 2,9 fois leur dernière valorisation était séduisant, surtout dans un environnement où les hyperscalers (OpenAI, Google, AWS) développent leurs propres XPUs. L’acquihire, plutôt qu’un achat total, est une tactique défensive : elle permet à Nvidia d’acquérir des talents et des technologies sans déclencher les mécanismes antitrust, après les échecs précédents avec Mellanox et Arm. Cette stratégie est d’autant plus pertinente que les régulateurs américains et européens scrutent de près les fusions dans le secteur de l’IA. Le fait que Ross devienne architecte logiciel chez Nvidia et Madra vice-président matériel souligne l’importance stratégique de cette opération. Le rachat d’Enfabrica, plus discret, est tout aussi significatif. La société avait développé une puce ACF-S, le « SuperNIC », capable de fusionner la mémoire étendue, l’I/O hôte et les interconnexions réseau dans un seul composant. Son système Emfasys, lancé en juillet 2025, permettait de doubler le débit des GPU NVL72 en réduisant de moitié le coût par jeton d’inférence. Cette technologie, qui repense l’architecture rack-scale, pourrait être la clé d’un nouveau type de machine d’inférence, moins dépendante des GPU traditionnels. Ces deux acquihires laissent penser que Nvidia prépare une nouvelle génération de systèmes d’inférence, potentiellement fondés sur une architecture hybride combinant LPU, mémoire étendue et interconnects avancées. Mais il est tout aussi plausible qu’il s’agisse d’une stratégie purement défensive : s’assurer que ses rivaux (Intel, AMD, Cerebras) n’acquièrent pas ces technologies critiques. Comme avec Transitive, dont Apple a utilisé la technologie pour Rosetta avant de la laisser mourir, Nvidia pourrait aussi garder ces innovations en réserve. En somme, ces deux opérations ne sont pas seulement des acquisitions de talents ou de brevets, mais des signes d’une transformation profonde de l’architecture d’inférence. Nvidia ne cherche plus seulement à améliorer ses GPU, mais à réinventer le matériel d’IA. L’avenir pourrait bien ne plus porter le nom de GPU, mais celui d’un système intégré, conçu pour l’inférence à grande échelle, à faible coût et haute performance.

Liens associés

Nvidia rachète Groq et Enfabrica : une stratégie secrète pour réinventer l’inference IA ? | Articles tendance | HyperAI