HyperAI

Die neuesten Ergebnisse der MLPerf Training 6.0-Benchmarkreihe belegen die führende Position von NVIDIA auf dem Markt für KI-Trainingsinfrastruktur. Die Blackwell-Plattform dominierte sämtliche Kategorien des rigorosen Industrie-Tests und bestätigt ihre Eignung für das Training hochkomplexer frontier-Modelle. Im Fokus stehen dabei die Kombination aus hoher Rechenleistung, skalierbarer Architektur und produktionstauglicher Zuverlässigkeit. Performance und Skalierung bildeten das Kernergebnis. NVIDIA reichte die schnellsten Trainingszeiten auf allen sieben Benchmarks ein, einschließlich zweier neu aufgenommener Mixture-of-Experts-Workloads: DeepSeek-V3 671B und GPT-OSS-20B. Mit dem Rack-Format GB200 NVL72 erreichte das Unternehmen mit 8.192 GPUs für DeepSeek-V3 671B den größten Blackwell-basierten Cluster in der Geschichte der Tests. Für das dichte Sprachmodell Llama 3.1 405B wurden 5.120 GPUs eingesetzt. Der Übergang zur Blackwell Ultra-Architektur im GB300 NVL72 beschleunigte die Trainingsdurchführung um bis zu 60 Prozent gegenüber dem Vorgänger. Treiber sind die erhöhte Rechendichte, die erweiterte Speicherkapazität und die NVFP4-Trainingsmethode, die hohe Performance bei strikten Genauigkeitsanforderungen ermöglicht. Die NVLink Switches der fünften Generation stellen sicher, dass die 72 GPUs pro Rack als einheitlicher Compute-Verbund agieren und die bei MoE-Architekturen kritischen All-to-All-Kommunikationen effizient bewältigen. Für den Produktiveinsatz ist Resilienz entscheidend. NVIDIA optimierte die Plattform präventiv durch über 30 Fertigungstests sowie die Reliability, Availability and Serviceability Engine, die Defekte automatisch umgeht. Das Netzwerk-Ökosystem mit Spectrum-X Ethernet leitet Datenverkehr bei Ausfällen innerhalb von Millisekunden um. Das NVRx-System sorgt für automatische Erkennung ineffizienter Knoten sowie das Wiederanlaufmanagement über gespeicherte Checkpoints, sodass mehrtägige Trainingsläufe ohne vollständigen Neustart fortgesetzt werden können. Die praktische Bedeutung zeigt sich im Partner-Ökosystem. Siebzehn Organisationen, darunter Microsoft Azure, Google Cloud, CoreWeave, Dell Technologies und Supermicro, nutzten die Infrastruktur. Cohere reduzierte die Trainingszeit für sein Modell um das Dreifache, Midjourney baut auf CoreWeave eine Blackwell Ultra-Flotte für künftige Bild- und Videomodelle auf. Google Cloud verzeichnete für Thinking Machines Lab eine Verdopplung der Geschwindigkeit. Auf der Nebius-Cloud konnte Higgsfield die Trainingszeit um 30 Prozent senken und bedient mit der beschleunigten Infrastruktur über 22 Millionen Nutzer, die täglich sechs Millionen KI-Inhalte generieren. Die Benchmark-Ergebnisse markieren einen Wendepunkt in der KI-Infrastruktur. Durch die Integration von Rechenleistung, Netzwerkbandbreite und Software-Optimierung setzt NVIDIA neue Maßstäbe für die Skalierbarkeit und Wirtschaftlichkeit von Trainingsjobs. Unternehmen und Forschungseinrichtungen können frontier-Modelle nun schneller entwickeln und mit geringeren Betriebskosten in die Produktion bringen, was Blackwell zur Grundlage für die nächste Generation autonomer und multimodaler KI-Systeme macht.

Verwandte Links

Verwandte Links

Verwandte Links

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Command Palette

NVIDIA Blackwell dominiert MLPerf Training 6.0

Verwandte Links

Command Palette

NVIDIA Blackwell dominiert MLPerf Training 6.0

Verwandte Links

Command Palette

NVIDIA Blackwell dominiert MLPerf Training 6.0

Verwandte Links

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.