HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA: KI und Roboter führen autonome Experimente durch

NVIDIA hat mit dem ENPIRE-Projekt einen Meilenstein auf dem Gebiet der physischen Künstlichen Intelligenz vorgestellt. Initiiert von Jim Fan, Senior Research Scientist und Leiter für Embodied AI bei NVIDIA, zielt die Initiative darauf ab, den Forschungsprozess in Robotiklaboren vollständig zu automatisieren. Im Kern verbindet ENPIRE acht KI-Coding-Agenten mit acht physischen Robotereinheiten, die jeweils über zwei sechsachsige YAM-Manipulatoren, Intel-Realsense-Tiefenkameras und lokale Workstations mit NVIDIA-RTX-5090-Grafikkarten verfügen. Alle Trainings- und Inferenzprozesse laufen dezentral und ohne Abhängigkeit von shared Computing-Clustern ab. Das System operiert in zwei klar definierten Phasen. Zunächst wird durch menschliche Eingriffe eine sichere Basisinfrastruktur etabliert, die Sicherheitszonen, automatische Reset-Mechanismen und Verifikationsprotokolle umfasst. Anschließend übernimmt die volle Autonomie: Die Coding-Agenten analysieren wissenschaftliche Literatur, formulieren algorithmische Hypothesen, schreiben und testen Code auf den Robotern und optimieren die Ergebnisse iterativ, bis die Zielparameter erreicht sind. Dabei wurde eine parallele Testumgebung mit den Modellen Codex, Claude Code und Kimi Code durchlaufen. Codex zeigte sich als überlegen, insbesondere durch die kürzeste Zeit bis zur Zielerreichung in realen Szenarien. Zur Validierung wurden komplexe Aufgaben wie das Verschieben von T-förmigen Blöcken, präzises Einfädeln von Nadeln in vier Millimeter große Öffnungen, das Einsetzen von GPU-Modulen in Mainboards sowie das Schneiden von Kabelbindern implementiert. Besonders hervorzuheben ist die Fähigkeit der Agenten, eigenständig zwischen Verhaltensklonen und verschiedenen Formaten des Reinforcement Learning zu wechseln und Hyperparameter autonom anzupassen. Ein dokumentierter Idea Tree verdeutlicht, wie verschiedene Agenten parallele Forschungsstrategien verfolgen, erfolgreiche Ansätze automatisch zusammenführen und ineffektive Pfade verwerfen. Bereits eine einzige Anpassung der Regularisierung im Verhaltensklonen steigerte die Erfolgsrate um 10,8 Prozent. Ein zentrales Ergebnis des Projekts ist die Beobachtung eines Skalierungseffekts: Während ein einzelner Roboter über anderthalb Stunden benötigte, um die Einfügel-Task mit nahezu perfekter Zuverlässigkeit abzuschließen, sank diese Zeit auf knapp fünfzig Minuten bei vier Robotern und auf etwa vierzig Minuten bei der vollen Achter-Flotte. Diese Beschleunigung geht jedoch mit einem überproportionalen Anstieg des Token-Verbrauchs einher, da die Agenten kontinuierlich die Forschungsfortschritte ihrer Kollegen integrieren müssen. Zusätzlich wurde gezeigt, dass textbasierte Erfahrungsberichte zwischen Aufgaben übertragen werden können und so das Lernen auf neue Kontexte wie die GPU-Installation beschleunigen. ENPIRE markiert damit den ersten konkreten Schritt hin zu einem physischen AutoResearch-Zyklus und erweitert die Physical-AI-Strategie des NVIDIA-GEAR-Labors deutlich über reine Simulationen hinaus. Das Team plant, die zugrundeliegende Architektur und den Code vollständig zu veröffentlichen. Aktuell bleibt das System jedoch auf strukturierte Tischumgebungen beschränkt und erfordert weiterhin manuelle Vorarbeiten für Sicherheit und Umgebungsinitialisierung. Dennoch demonstriert ENPIRE eindrucksvoll, wie parallele KI-Agenten die Entwicklung physischer Intelligenz beschleunigen können und welche rechnerischen Trade-offs mit steigender Roboteranzahl einhergehen.

Verwandte Links

NVIDIA: KI und Roboter führen autonome Experimente durch | Aktuelle Beiträge | HyperAI