HyperAI

NVIDIA lance un nouveau modèle commercial pour démocratiser l'accès aux infrastructures de calcul à l'intelligence artificielle à grande échelle. Alors que le domaine bascule de la phase de développement vers l'inférence en production, la demande en puissance informatique explose. Les acteurs du secteur privilégient désormais des centres de traitement continus capables de générer des millions de tokens quotidiens, tout en maîtrisant leurs coûts. Historiquement, la construction de telles infrastructures exigeait des investissements massifs et des délais longs, limitant l'accès des startups et des nouveaux venus. Pour pallier ce problème, NVIDIA propose une approche fondée sur le partage de revenus et un soutien financier, en collaboration avec des fournisseurs de cloud IA. Ces derniers acquièrent le matériel NVIDIA pour le revendre sous forme de services. NVIDIA perçoit ainsi un revenu classique, complété par une part des revenus générés par l'utilisation des capacités vendues. Cette structure accélère l'adoption de ses plateformes au sein de l'écosystème IA naissant, tout en lui garantissant un flux de revenus récurrent, directement indexé sur la consommation. Pour les éditeurs de modèles, les développeurs d'agents et les entreprises, cette initiative offre un accès immédiat à une informatique accélérée complète, sans attendre les étapes souvent longues de choix de site, de raccordement électrique ou de mise en service. Le projet est déjà opérationnel avec des centres de données de type DSX conçus pour desservir plusieurs régions. Sharon AI et Firmus figurent parmi les premiers partenaires à tester ce nouveau dispositif. Sharon AI déploie jusqu'à 40 000 puces GPU Grace Blackwell GB300 pour renforcer son infrastructure souveraine. Firmus, quant à lui, aménage sur l'île de Batam en Indonésie un campus spécialisé pouvant atteindre 360 mégawatts et abriter jusqu'à 170 000 GPU NVIDIA. Ces réalisations répondent directement aux besoins d'entreprises comme Baseten, Fireworks AI ou Together AI, qui exigent à la fois une capacité évolutive pour l'entraînement et l'ajustement des modèles, et une flexibilité commerciale pour passer du pilote à l'industrialisation. En alignant les intérêts financiers et techniques, NVIDIA vise à transformer la disponibilité du calcul haute performance en un service agile, indispensable à la montée en puissance des applications IA modernes.

Liens associés

Liens associés

Liens associés

Aperçu De l'événement | AI Computing, TileRT, Tencent, Huawei Et AI Computing Innovation Unissent Leurs Forces Pour Explorer l'optimisation Collaborative Multiniveaux

Aperçu De l'événement | AI Computing, TileRT, Tencent, Huawei Et AI Computing Innovation Unissent Leurs Forces Pour Explorer l'optimisation Collaborative Multiniveaux

Command Palette

NVIDIA construit ses AI factories avec des partenaires cloud

Liens associés

Command Palette

NVIDIA construit ses AI factories avec des partenaires cloud

Liens associés

Command Palette

NVIDIA construit ses AI factories avec des partenaires cloud

Liens associés

Aperçu De l'événement | AI Computing, TileRT, Tencent, Huawei Et AI Computing Innovation Unissent Leurs Forces Pour Explorer l'optimisation Collaborative Multiniveaux

Aperçu De l'événement | AI Computing, TileRT, Tencent, Huawei Et AI Computing Innovation Unissent Leurs Forces Pour Explorer l'optimisation Collaborative Multiniveaux