HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

OmniWorld: Ein mehrdomänen- und multimodales Datensatz für die 4D-Weltenmodellierung

OmniWorld: Ein mehrdomänen- und multimodales Datensatz für die 4D-Weltenmodellierung

Abstract

Das Feld der 4D-Weltenmodellierung – mit dem Ziel, räumliche Geometrie und zeitliche Dynamik gemeinsam zu erfassen – hat in den letzten Jahren bemerkenswerte Fortschritte gemacht, getrieben durch Fortschritte in großskaligen generativen Modellen und multimodalen Lernverfahren. Doch die Entwicklung wirklich allgemeiner 4D-Weltenmodelle bleibt grundlegend durch die Verfügbarkeit hochwertiger Daten eingeschränkt. Bestehende Datensätze und Benchmark-Tests fehlen oft an der erforderlichen dynamischen Komplexität, vielfältiger Domänenvielfalt sowie räumlich-zeitlichen Annotationen, um zentrale Aufgaben wie die 4D-Geometrierekonstruktion, zukünftige Vorhersage und kameraorientierte Videogenerierung zu unterstützen. Um diese Lücke zu schließen, stellen wir OmniWorld vor – einen großskaligen, mehrdomänen- und multimodalen Datensatz, speziell für die 4D-Weltenmodellierung konzipiert. OmniWorld besteht aus einem neu erfassten OmniWorld-Game-Datensatz sowie mehreren ausgewählten öffentlichen Datensätzen, die sich über unterschiedliche Domänen erstrecken. Im Vergleich zu bestehenden synthetischen Datensätzen bietet OmniWorld-Game eine umfassendere Modalitätenabdeckung, eine größere Skalierung und realistischere dynamische Interaktionen. Auf Basis dieses Datensatzes etablieren wir einen anspruchsvollen Benchmark, der die Grenzen aktueller State-of-the-Art (SOTA)-Ansätze bei der Modellierung komplexer 4D-Umgebungen aufzeigt. Zudem führt die Feinabstimmung bestehender SOTA-Methoden auf OmniWorld zu signifikanten Leistungssteigerungen bei Aufgaben der 4D-Rekonstruktion und Videogenerierung, was OmniWorld als eine leistungsstarke Ressource für Training und Evaluation eindrucksvoll belegt. Wir sehen OmniWorld als einen Treiber für die Beschleunigung der Entwicklung allgemeiner 4D-Weltenmodelle und damit letztlich als Beitrag zur vertieften, ganzheitlichen Verständnis der physischen Welt durch Maschinen.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
OmniWorld: Ein mehrdomänen- und multimodales Datensatz für die 4D-Weltenmodellierung | Forschungsarbeiten | HyperAI