HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 3 jours
NVIDIA
Benchmarks
Agent

NVIDIA Blackwell, leader IA

L'infrastructure NVIDIA Blackwell Ultra NVL72 se distingue lors de la première édition du benchmark AgentPerf, publié par Artificial Analysis. Cette plateforme mesure la capacité des systèmes à exécuter des tâches complexes nécessitant de multiples appels de modèles de langage et d'outils. Les résultats démontrent que le système NVIDIA GB300 NVL72 offre des performances de pointe, traitant jusqu'à vingt fois plus d'agents par mégawatt que l'architecture précédente NVIDIA Hopper. Contrairement à l'IA conversationnelle qui répond à une requête unique, l'IA agentique fonctionne comme une chaîne de décisions. Elle décompose un objectif en plusieurs étapes, enchaîne les appels à des modèles et des outils, et gère des contextes de plus en plus larges. Cette complexité multiplicative nécessite une infrastructure spécialisée. Le benchmark AgentPerf évalue ces performances à l'aide du modèle DeepSeek V4 Pro et simule des scénarios réels de développement logiciel, mesurant le nombre de tâches concurrentes supportées par accélérateur et par unité d'énergie. L'avantage de la plateforme repose sur une optimisation matérielle et logicielle intégrale. En regroupant soixante-douze GPU dans un seul rack, le système distribue efficacement les modèles à experts multiples. Les noyaux CUDA superposent calculs et communications pour réduire les latences, tandis que TensorRT LLM optimise le traitement des données à mesure que le nombre de sessions simultanées augmente. Ces résultats permettent aux entreprises de dimensionner précisément leurs investissements en infrastructure pour déployer des agents à grande échelle. Plusieurs acteurs majeurs du secteur utilisent déjà cette technologie en production. Les fournisseurs Baseten, DeepInfra et Together AI exécutent des charges de travail d'IA agentique sur des modèles de pointe alimentant des applications concrètes, comme l'assistance au code en temps réel ou la gestion automatisée des services automobiles. Parallèlement, l'architecture NVIDIA Vera Rubin est désormais en production commerciale, garantissant une capacité de calcul adaptée à la croissance continue de l'IA agentique. Les développeurs logiciels continuent d'améliorer l'efficacité énergétique de ces systèmes, consolidant la position de NVIDIA dans ce segment en pleine expansion.

Liens associés