NitroGen: Ein offenes Grundmodell für allgemeine Spielen-Agents
NitroGen: Ein offenes Grundmodell für allgemeine Spielen-Agents
Abstract
Wir stellen NitroGen vor, ein vision-basiertes, handlungsorientiertes Grundmodell für allgemein einsetzbare Spielagenten, das auf 40.000 Stunden Gameplay-Videos aus über 1.000 Spielen trainiert wurde. Unser Ansatz berücksichtigt drei zentrale Komponenten: 1) ein internetweit skaliertes Video-Action-Datensatz, der durch automatisierte Extraktion von Spieleraktionen aus öffentlich verfügbaren Gameplay-Videos erstellt wurde; 2) eine mehrspielerfähige Benchmark-Umgebung, die die Übertragbarkeit zwischen Spielen messen kann; und 3) ein einheitliches Vision-Action-Modell, das mittels großskaliger Verhaltensklonierung trainiert wurde. NitroGen zeigt starke Kompetenz in vielfältigen Domänen, darunter Kampfgegenstände in 3D-Aktionsspielen, hochpräzise Steuerung in 2D-Plattformern sowie Exploration in prozedural generierten Welten. Es überträgt sich effektiv auf bisher unbekannte Spiele und erreicht gegenüber Modellen, die von Grund auf neu trainiert wurden, bis zu 52 % höhere relative Verbesserung der Aufgaben-Erfolgsraten. Wir veröffentlichen den Datensatz, die Evaluierungsumgebung sowie die Modellgewichte, um die Forschung zu allgemein einsetzbaren, körperhaften Agenten voranzutreiben.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.