HyperAIHyperAI

Command Palette

Search for a command to run...

GTC 2026 | Von Vera Rubin Bis NemoClaw: Geht Nvidias Zukunft Über GPUs Hinaus?

Featured Image

Die Keynote-Rede von CEO Jensen Huang auf der jährlichen NVIDIA GTC gilt seit jeher als wichtiger Indikator für die globale KI-Branche. Von GPU-Architekturen der nächsten Generation bis hin zur Entwicklung des Software-Ökosystems – diese Keynote gibt oft einen Ausblick auf die wichtigsten Technologien und Entwicklungsrichtungen der KI-Computing-Infrastruktur der kommenden Jahre.

Am 16. März Ortszeit fand planmäßig die Keynote-Rede der GTC 2026 statt. Der 63-jährige Jensen Huang erschien in seiner charakteristischen Lederjacke und präsentierte mit Begeisterung eine Reihe wichtiger neuer Produkte im San Jose Stadium in Kalifornien.

Nicht nur GPUs

Als „Starprodukt“ in NVIDIAs Roadmap für KI-Chips,Die Vera-Rubin-Plattform weckte auch bei den Zuschauern der diesjährigen GTC-Konferenz großes Interesse – sie besteht aus 7 bahnbrechenden Chips, 5 Racks und 1 Supercomputer.Jensen Huang bezeichnete es als einen Technologiesprung. Zu den bemerkenswertesten Neuerungen zählen die Rubin-GPU, die NVIDIA Groq 3 LPX und die NVIDIA Vera-CPU.

Zunächst einmal die Rubin-GPU, eine brandneue Architektur, die speziell für Agentic AI entwickelt wurde und im Januar dieses Jahres offiziell vorgestellt wurde. Sie verfügt über eine Transformer Engine der dritten Generation mit hardwarebeschleunigter adaptiver Komprimierung, die 50 Petaflops NVFP4-Rechenleistung für KI-Inferenz bietet und NVLink 72 Full Interconnect unterstützt.

Zweitens ist da die Implementierung der Groq-Technologie bei NVIDIA. Seit Jensen Huang Ende 2025 20 Milliarden US-Dollar für den Erwerb einer Lizenz für die Groq-Technologie ausgab, wurde spekuliert, dass dieser Schritt ein „Wechsel von GPUs zu LPUs“ sei. Nun hat sich die Aufregung gelegt, und die beiden Technologien ergänzen sich hervorragend.

In großflächigen Implementierungen fungieren LPU-Cluster als massiver Einzelprozessor zur Beschleunigung schneller, deterministischer Inferenz. Im Zusammenspiel mit Vera Rubin NVL72 verbessern die Rubin-GPUs und LPUs gemeinsam die Dekodierungsleistung, indem sie jede Schicht des KI-Modells für jedes Ausgabetoken berechnen. Darauf aufbauend hat NVIDIA das LPX-Rack mit 256 LPU-Prozessoren eingeführt, das speziell für die Anforderungen von Agentensystemen hinsichtlich geringer Latenz und großem Kontextumfang entwickelt wurde.In Kombination mit Vera Rubin kann es den Inferenzdurchsatz pro Megawatt für Billionen-Parameter-Modelle um das bis zu 35-Fache steigern.

Und schließlich gibt es noch die NVIDIA Vera CPU, den weltweit ersten Prozessor, der für das Zeitalter der agentenbasierten KI und des bestärkenden Lernens entwickelt wurde.Seine Betriebseffizienz ist doppelt so hoch wie die von herkömmlichen Rackmount-CPUs, und seine Betriebsgeschwindigkeit ist höher als die des 50%.Es ermöglicht einen höheren KI-Durchsatz, schnellere Reaktionszeiten und höhere Effizienz für umfangreiche KI-Dienste wie Programmierassistenten und intelligente Agenten für Verbraucher und Unternehmen. Jensen Huang erklärte: „Die CPU unterstützt nicht länger nur Modelle, sondern treibt sie an. Dank bahnbrechender Leistung und Energieeffizienz ermöglicht Vera KI-Systeme, die schneller denken und effektiver skalieren.“

Darauf aufbauend brachte NVIDIA auch ein brandneues Vera CPU-Rack heraus, das 256 flüssigkeitsgekühlte Vera CPUs integriert und mehr als 22.500 gleichzeitige CPU-Umgebungen unterstützt, von denen jede unabhängig mit voller Geschwindigkeit laufen kann.

Vera CPU-Rack, Bildquelle: Offizielle NVIDIA-Website

Mit dem Debüt von Vera Rubin stärkt NVIDIA seine Wettbewerbsfähigkeit im Zeitalter der agentenbasierten KI. Von der Rechenleistung der Vera-CPU über die herausragende Inferenzleistung der Rubin-GPU bis hin zur Speicherrevolution der BlueField-4-DPU – NVIDIA treibt die Entwicklung von KI-Systemen durch innovative, kollaborative Designprozesse auf jedem Glied der Kette voran.

Für Entwickler und Unternehmen, die zwar von den Vorteilen einer so umfangreichen und sich ständig verbessernden Chip-Matrix profitieren, ergibt sich jedoch eine praktische Herausforderung: Wie können sie angesichts immer komplexerer GPU-Modelle und einer Vielzahl von Kennzahlen zur Rechenleistung über die Herstellerangaben hinausgehen und die tatsächliche Leistung verschiedener Hardware objektiv vergleichen? Anders gefragt: Wie können sie aus der Vielzahl an Optionen die am besten geeignete für ihr Unternehmen ermitteln?

In Anbetracht dessenHyperAI hat eine „GPU-Rangliste“ ins Leben gerufen, um eine Referenzplattform für die GPU-Auswahl und Entscheidungsfindung in KI-/großen Modell-/HPC-Szenarien zu schaffen.Es unterstützt hersteller- und architekturübergreifende Vergleiche mithilfe einheitlicher Vergleichsregeln, um Anwendern fundierte technische Entscheidungen im komplexen Markt für GPU-/KI-Beschleuniger zu ermöglichen. HyperAI hält Sie über die neuesten Produktaktualisierungen auf dem Laufenden und bietet Entwicklern praxisorientierte Werkzeuge für reale KI-Anwendungen.

Der neu veröffentlichte Rubin-GPU-Leistungsvergleich ist jetzt verfügbar. Sehen Sie sich jetzt die GPU-Rangliste an:

https://hyper.ai/gpu-leaderboard

NemoClaw: OpenClaw mit einem einzigen Befehl optimieren.

Im Anschluss an die Veröffentlichung seiner Roadmap für Chips der nächsten Generation präsentierte NVIDIA gleichzeitig seine Antwort auf die „nächste Stufe der KI“ auf Softwareebene: NemoClaw.

„OpenClaw hat die nächste Stufe der KI für alle zugänglich gemacht und sich zum am schnellsten wachsenden Open-Source-Projekt der Geschichte entwickelt“, lobte Huang Renxun das Projekt in höchsten Tönen. „Mac und Windows sind die Betriebssysteme für PCs …“OpenClaw hingegen ist ein Betriebssystem für persönliche KI.Dies ist der Moment, auf den die gesamte Branche gewartet hat – der Beginn einer neuen Software-Renaissance.

NemoClaw nutzt die NVIDIA Agent Toolkit Software, um OpenClaw mit einem einzigen Befehl zu optimieren.Dadurch wird es direkt in das NVIDIA-Ökosystem integriert. NemoClaw installiert OpenShell und bietet so ein Open-Source-Modell sowie eine isolierte Sandbox-Umgebung, um Datenschutz und Sicherheit für autonome Agenten zu verbessern. Diese Lösung stattet die Claws mit einer bisher fehlenden Infrastrukturschicht aus und ermöglicht ihnen den Zugriff auf die für die Ausführung von Aufgaben notwendigen Daten, während gleichzeitig richtlinienbasierte Sicherheits-, Netzwerk- und Datenschutzvorkehrungen getroffen werden. (Siehe Abbildung unten.)

NemoClaw unterstützt die Verwendung beliebiger programmierbarer Agenten. Dank seiner offenen Agentenarchitektur kann es Open-Source-Modelle (einschließlich NVIDIA Nemotron) aufrufen, die auf dem lokalen System des Benutzers laufen. Gleichzeitig kann der Agent über einen Privacy Router auch auf hochmoderne Modelle in der Cloud zugreifen.Die Kombination aus lokalen und Cloud-basierten Modellen bietet Agenten die Grundlage, neue Fähigkeiten zu erlernen und komplexe Aufgaben innerhalb der festgelegten Datenschutz- und Sicherheitsbeschränkungen zu bewältigen.

In diesem Kontext nimmt Jensen Huangs Fokus auf ein „persönliches KI-Betriebssystem“ konkretere Formen an: Agenten sind nicht länger nur Schnittstellen zum Aufrufen von Modellen, sondern digitale Ausführende, die zu langfristigem Betrieb und kontinuierlichem Lernen fähig sind. Während die neu erschienenen GPUs und die Systemarchitektur die Rechenleistung für diese Vision bereitstellen, definiert NemoClaw die Funktionsweise und die Sicherheitsgrenzen des Agenten auf Softwareebene – zusammen bilden sie NVIDIAs vollständige Vision von „KI-Fabriken“ und „KI-Arbeitskräften“.

NemoClaw senkt die Entwicklungsschwelle für OpenClaw in gewissem Maße weiter. Für Entwickler ist die schnelle Validierung von Anwendungsfällen jedoch ebenso wichtig; daherHyperAI bietet Entwicklern weltweit eine sofort einsatzbereite Laufzeitumgebung und Online-Notebooks.Sie können ohne komplizierte Konfiguration mit dem Aufbau Ihres eigenen KI-Agenten beginnen.

Online-Lauflink:
OpenClaw: API-Aufrufe mit freier CPU ausführen
https://hyper.ai/notebooks/49888

 OpenClaw GPU-Ausführungs-Tutorial
https://hyper.ai/notebooks/49890

Die jährliche GTC-Konferenz gilt seit Langem als das „Frühlingsfest der KI“ – nicht nur als Bühne für NVIDIA, um seine Kompetenzen zu präsentieren, sondern auch als Trendsetter für neue Technologien. Zahlreiche Medien berichteten über dieses technologische Spektakel, und diverse Produkt- und Modellaktualisierungen erregten großes Aufsehen. HyperAI wird in der kommenden Zeit weiterhin detaillierte Informationen zu den auf dieser Konferenz vorgestellten hochwertigen Open-Source-Modellen und Datensätzen bereitstellen und Online-Angebote anbieten. Seien Sie gespannt.